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(54) Title: PROCESS FOR EXCHANGING INFORMATION IN A MULTIPROCESSOR SYSTEM 
(54) litre: PROCEDE D'ECHANGE DTNFO RMATION DANS UN SYSTEME MULTIPROCESSEUR 
(57) Abstract 

A multiprocessor system comprises a core memory (RAM), processing units (CPU r 
CPUn), each provided with a cache memory (MCj), a directory (RGj) and a management pro- 
cessor (PGj). The core memory (RAM) is connected to an assembly of shift registers (RDM r 
RDMJ in such-a way as to permit, in a cycle of said memory, a parallel transfer, by reading: 
or writing, of data blocks. Each cache memory (MCp is connected to a shift register (RDPj) 
in such a way as to permit a parallel transfer by reading or writing, of data blocks. An assem- 
bly of series connections (LS r LSjj) is provided between the assembly of memory shift regis- 
ters and the assembly of processor shift registers to permit the transfer of data blocks between 
each pair of associated registers (RDMj-RDPj). The addresses of the data blocks can be trans- 
mitted between processor (CPUj) and core memory (RAM) either by said series connections 
or by a common address bus (BUS A). The architecture according to the invention makes it 
possible to provide a large number of processing units while obtaining a high output from 
each processor. 

(57)Abrege " 8 ZZT 

L'invention concerne un systeme multiprocesseur du type comprenant une memoire centrale (RAM), des proces- 
seurs de traitement (CPUpCPUJ, chacun dote d'une memoire-cache (MCj), d'un repertoire (RG:) ( std'uB i processeur de 
gestion (PG?). La memoire centrale (RAM) est connectee a un ensemble de registres a decalages (RDM r RDM J defa^on 
a permettre, en un cycle de cette memoire, un transfert parallele en lecture ou 6criture des blocs ^informations. Chaque 
memoire-cache (MO) est reliee a un registre a d6calage (RDPj), de facon a permettre un transfert paraUele en lecture ou 
ecriture des blocs ^informations. Un ensemble de liaisons series (LSpLS^ est prevu entre 1'ensemble des registres a deca- 
lage memoires et 1'ensemble des registres a decalage processeurs, pour permettre Ie transfert de blocs d'informations entre 
chaque paire de registres associes (RDMj-RDPj). Les adresses des blocs d'informations peuvent etre transmises entre pro- 
cesseur (CPUO et memoire centrale (RAM), soit par 1'entremise de ces liaisons series, soil par un bus commun d'adresses 
(BUSA). L'architecture confonne a l'invention permet de prevoir un nombre eleve de processeurs de traitement, tout en 
beneficiant d'un rendement 61eve pour chaque processeur. 
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Procede d'echange d' information dans un systeme 
multiprocesseur. 

5 

L'invention concerne un s y s t § m e 
multiprocesseur de type comprenant une me^moire centrale, des 
processeurs de traitement et des mgmoires-caches associates aux 
processeurs de traitement. Elle s*6tend a un procSde* d'Schange 

10 d'inf ormations entre m^moire centrale et processeurs de 
traitement via la mdmo i re-cache associde a chacun de ces 
processeurs. Elle vise 6galement un nouveau composant v ci rcui t 
int^gre*, susceptible d'dquiper le systfcme multiprocesseur. 

On salt que, dans les systfemes 

15 m u 1 t i pr o c e s seu r s connus les plus usuels, toutes les 
informations (donn^es, adresses) transitent par un bus commun 
parallfcle de communication entre la m£moire centrale et les 
divers processeurs de traitement, qui constitue un goulot 
d f 6tranglement : son d£bit est en effet insuffisant pour 

20 alimenter tous'les processeurs a plein rendement, a partir 
d'une m^moire centrale commune. 

Pour augmenter le d6bit de transfert 
d'inf ormations, une premiere solution consiste a associer a 
chaque processeur de traitement une m^moire-cache qui, par la 

25 locality de 1' information, permet de r<§duire les demandes vers 
la memoire centrale. Toutefois, dans le cas oil le volume de 
donn6es partag^es entre processeurs est substantiel, le 
maintien de la coherence des donn^es entre m£moires engendre 
un trafic d'informations co m p 1 e" m en t a i r e sur le bus de 

30 communication qui s'oppose a une reduction significative du 
d^bit global sur ce bus et, done, enleve une grande partie de 
son intSrSt a cette solution. 

Une autre solution consiste a r^aliser le bus 
de communication sous la forme d'un r§seau maille* d6sign£ par 

35 "crossbar", qui permet une communication directe entre chaque 
processeur de traitement et chaque sous-ensemble de la mSmoire 
centrale ( banc-m6moi re) . Toutefois, cette solution est trfes 
lourde et trfes codteuse a re'aliser du fait du nombre trfcs 
Sieve" d f interconnexions, et elle devient totalement irr^aliste 

40 au-dele d'une dizaine de processeurs de traitement. De plus, 
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en cas de demandes multiples de plusieurs processeurs sur un 
mgme banc-me* moire , une telle solution implique des conflits 
d'accfes, source de ralent issement des ^changes. 
5 Une autre solution plus courante en raison de 

sa simplicity architectural consiste a associer une m^moire 
locale a chaque processeur de traitement pour stocker des „ 
donn6es sp^cifiques a celui-ci, et a m^moriser les donn^es 
partag£es dans la mdmoire centrale commune. Toutefois, le gros 

10 d£faut de cette architecture est sa non-transparence, c'est-e- 
dire la n^cessite* pour le programmeur d'organiser le detail 
des affectations des d o n n e* e s dans les diverses m£moires, de 
sorte que cette solution est d 1 utilisation tres 
contr aignan te.. De plus, en cas de volume £leve* de donn€es 

15 partag6ea, elle peut conduire comme pr£ce*demment a une 
saturation du bus d'acces a la m£moire centrale. 

Par ailleurs, une solution dite "architecture 
aquarius" a 6t6 proposed par l'Univer site* de Berkeley et 
consiste a am£liorer la solution crossbar pr£cite*e en 

20 combinant au r£seau crossbar, d'une part, pour les donne*es non 
partag^es, des me* moires-caches qui sont connect6es au r£seau 
crossbar, d'autre part, pour les donne^es partag^es, des 
m6 mo i res-caches distinctes qui sont connecters a un bus common 
de synchronisation* Cette solution apporte un gain en rapidity 

25 d'Schanges mais demeure tres lourde et tres couteuse a 
realiser. 

Lb prSsente invention se propose de fournir 
une nouvelle solution, permettant d'augmenter conside* rablement 
les debits d'e^change d r inf ormations, tout en gardant une 
30 architecture transparente pour 1 1 u t i 1 i sa t eur , beaucoup plus 
simple que 1 9 architecture crossbar. 

Un objectif de 1" invention est ainsi de * 
permettre d'augmenter notablement le norobre de processeurs de 
traitement du systeme, tout en b£n£ficiant d'un rendement *- 
35 ^leve* pour chaque processeur. 

Un autre objectif est de fournir une 
structure de compos ant circuit int£gre* t permettant une 
realisation tres simple de 1 'architecture de ce nouveau 
systeme multi processeur . 
40 A cet effet, le systeme multiprocesseur vise 
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par I'invention est du type comprenant une mSmoire centrale 
(RAM) organised en blocs d 1 informations (bi), des processeurs 
de traitement (CPU r .« CPUj... CPU R ), une mSmoire-cache (MCj) 
5 relive a cheque processeur de traitement (CPUj) et organised 
en blocs d'inf orroat ions (bi) de meroe taille que ceux de la 
mdmoire centrale, un repertoire (RGj) et son processeur de 
gestion (PGj) associ^s a cheque m <§ moi re-cache (MCj), des 
moyens de communication d'adresses de blocs entre processeurs 

10 (CPUj) et m<§moire centrale (RAM) ; selon la prSsente 
invention, ledit systeme mul tiprocesseur est dote* ! 

. d'un ensemble de registres h d<§calage, dit 
registres a d^calage mdmoire ( RDM j R D M j . . . RDM R ) , chaque 
registre (RDMj) de cet ensemble Stant connects b la mgmoire 

15 centrale (RAM) de fagon a permettre, en un cycle de cette 
mSmoire, un transfert parallele en lecture ou Scriture d'un 
bloc d'informations (bi) entre ledit registre et ladite 
m^moire centrale, 

• de registres a d<*calage, dits registres a 

20 d^calage processeur (RDP r .. RDPj... RDP n ), chaque reqistre b 
d^calage processeur (RDPj) 6tant relie* a la m«§moire- 
cache (MCj) d'un processeur (CPUj) de fagon h permettre un 
transfert parallele en lecture ou ilcriture d'un bloc 
d'informations (bi) entre ledit registre a d<§calage (RDPj) et 

25 ladite m£moire-cache (MCj), 

. d'un ensemble de liaisons series (LSj... 
LSj... L5 n ), chacune reliant un registre a ddcalage m£moire 
(RDM j) et un registre a d<§calage processeur (RDPj) et adapt<§e 
pour permettre le transfert de blocs d'informations (bi) entre 

30 les deux registres considers ( RDM j , RDPj). 

Ainsi, dans le systeme m u 1 t i p r o c e s s e u r 
conforms a I'invention, les ^changes entre mSmoires-caches et 
processeurs associ^s s'effectuent comme dans les systemes 
classiques £quip<§s de me* moires-caches. Par contre, les 

35 ^changes entre m<§moire centrale et m § m o i r e s - c a c h e s 
s'effectuent de fagon entierement originale. 

Chaque transfert de bloc d'informations (bi) 
depuis la mSmoire centrale (RAM) vers la m^moire-cache (MCj) 
d'un processeur donng (CPUj) consiste : 

40 . h transferer, en un cycle de m£moire 
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centrale, le bloc (bi) de ladite memoire centrale (RAM) vers 
le registre & decalage memoire (RDMj) (de la taille d'un bloc) 
qui est directement connects h la memoire centrale et qui 
5 correspond au processeur. (CPUj) consider, 

h transferer sur la liaison pie 
correspondante (LSj) le contenu de ce registre h decalage 
memoire (RDMj) vers le registre b decalage processeur (RDPj) 
(de mime capacity) qui est associe h la memoire-cache (MCj) du 
10 processeur consid6r6 (CPUj), 

. h transferer le contenu dudit registre h 
decalage processeur (RDPj) vers ladite memoire-cache (MCj). 

Dans le sens oppose, cheque transfert de bloc 
d'in forma t ions (bi) depuis la m 6 m o i r e-c a ch e (MCj) d'un 
15 processeur donne (CPUj) vers la memoire centrale (RAM) 
consiste : 

. h transferer le bloc (bi) de ladite 
memoire-cache consideree (MCj) vers le registre h decalage 
processeur (RDPj) qui est associe b ladite memoire-cache 
20 (MCj), 

h transferer sur la liaison serie 
correspondante C L S j ) le contenu du registre a' decalage 
processeur (RDPj) vers le registre h decalage memoire (RDMj), 
affecte au processeur consider (parmi I'ensemble de registres 
25 h decalage (RDM^.. RDMj... RDM n ) connectes h la memoire 
centrale (RAM)), 

. h transferer, en un cycle de memoire 
centrale, le contenu du registre h decalage memoire (RDMj) 
vers ladite memoire centrale (RAM). 

30 Dans ces conditions, le transfert de chaque 

bloc d'informations (bi) s'effectue, non plus h travers un bus 
parallfele comme c'est le cas dans les systfemes connus, mais 
par des liaisons series h haut debit. Ces liaisons series 
permettent d'obtenir des temps de transfert de chaque bloc 

35 (bi) comparables et meme inferieurs aux temps de transfert 
dans les systfemes connus h bus parallfele. Uexemple comparatif 
ci-dessous donne avec des valeurs de paramfetre courantes pour 
la technologie actueile, illustre clairement ce fait qui 
semble paradoxal. 

40 On suppose que chaque bloc d 1 informations 
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(bi) est d'une taille Sgale k 64 octets. 

Dans le systeme de I'invention, le temps de 
transfert entre la memoirs centrale et une m£ mo i re-cache se 
5 decompose en : 

- un temps de transfert m^moire centrale 
(RAM)/registre a dScalage m6moire ( RDM j ) : 100 nanosecondes 
(performance d'une mSmoire centrale a acces altSatoire de type 
courant ) , 

10 - un temps de transfert s£rie sur la liaison- 

S 6rie correspondante : 64 x B x 1/500. 10 6 , soit 1 024 
nanosecondes, en supposant une frequence do transfert de 
500 Megahertz (non excep t ionnel 1 e avec les technologies 
actuelles qui autorisent des frequences atteignant 

15 3 000 Megahertz), 

- un temps de transfert registre b d^calage 
processeur (RDP j)/m6moire-cache (MCj) s 50 nanosecondes 
(mSmoire-cache de type tres courant). 

Le temps de transfert total d'un bloc est 
20 done de I'ordre de 1 200 nanosecondes (en integrant des deSlais 
d 1 enchalnement de second ordre). 

Dans les systemes connus a m^moires-caches 
dans lesquels les ^changes d'inf ormat ions s'effectuent 
directement en parallele par mots de 4 octets (systfemes les 
25 plus courants conduisant a des bus de type habituel a 32 fils 
de donn<§es), le temps de transfert d'un bloc est «§gal au temps 
de transfert des 16 mots de 4 octets qui constituent ce bloc, 
e'est-a-dire : 16 x 100 r 1 600 nanosecondes. 

On voit dene que, avec des hypotheses 
30 inoyennes dans les deux solutions, ces temps sont comparables. 
Or, si I'on compare l f a rchi tec ture du systfeme conforme a 
^invention et celle h bus parallele commun avec mdmoires- 
caches (premiere solution SvoquSe prdc^demmen t) , I'on constate 
que : 

35 . dans la solution classique (bus commun 

parallele), la mdmoire centrale et le bus commun sont occupies 
a 100 % pendant le transfert, puisque des informations 
circulent entre les deux pendant toute la duree du transfert, 
. dans le systeme conforme a invention, la 

40 liaison s<§rie est occuptle h 100 % pendant le transfert, mais 
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la ra e m o i r e centraie est o c c u p e e moins de 10 % du temps de 
transfert (temps de lecture memoire et de chargement du 
registre h decalage memoire (RDM j)), de sorte que la memoire 
5 centraie peut servir 10 fois plus de processeurs que dans le 
cas precedent (l'occupation de la liaison s6rie etant sans 
importance puisqu'elle est privee et affected au processeur). 

II faut souligner f par ailleurs, que dans le 
systeme de I'invention, cheque liaison s£rie qui relie cheque 
10 processeur de facon individuelle a la memoire centraie est une 
liaison simple (a un ou deux fils de donnees), de sorte que le 
rSseau s6rie ainsi constitue n'est pas comparable sur le plan 
de la complexity avec, par exemple, un rSseau crossbar dont 
cheque liaison est une liaison parallele a multiplicity de 
15 fils (32 fils de donn£es dans l'exemple comparatif precite), 
avec tous les commutateurs necessaires. 

En outre, comme on le verra plus loin sur les 
courbes comparatives, le systeme conforme a I'invention 
possede des performances tres amdliorees par rapport aux 
20 systemes tradi tionnels a bus commun et permet en pratique la 
mise en oeuvre d'un nombre de processeurs de traitement 
beaucoup plus Sieve* (de plusieurs dizaines a une centaine de 
processeurs) ? ces performances sont compatibles a celles d'un 
systeme crossbar, mais le systeme conforme a l'invention est 
25 d'une simplicity architecturale beaucoup plus grande. 

Dans le systeme de l'invention, chaque 
liaison s£rie peut en pratique etre realise? soit au moyen de 
deux liens-series uni di recti onnels de transfert bit a bit, 
soit au moyen d'un seul lien bidirectionnel. 
30 Dans le premier cas, chaque registre a 

decalage memoire (RDMj) et chaque registre a decalage 
processeur (RDPj) sont dedoubies en deux registres, l'un 
specialise pour le transfert dans un sens, I'autre pour le 
transfert dans I'autre sens. Les deux liens-series 
35 unidirectionnels sont alors connected au registre a decalage 
memoire (RDM j) dedoubie et au registre a decalage processeur 
correspondent (RDPj) dedoubie, de facon a per mettre, 1' un un 
transfert dans un sens, i'autre un transfert dans I'autre 
sens . 

40 Ce mode de realisation a deux liens 
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unidirectionnels presents l'avantage de ne necessiter aucune 
gestion de transfert sup lien, mais l ! inconv6nient de doubler 
les ressources necessaires (lien, registres). 
5 D&ns le second cas, une logique de validation 

du sens de transfert est associ<§e au lien bidirec tionnel de 
facon a permettre un transfert alterne dans les deux sens sur 
ledit lien* Cette logique peut §tre int<§gr«§e au processeur de 
gestion (PGj) associe a la m<§moire-cache (MCj) a laquelle est 
10 relie ledit lien bidirectionnel. 

Bien entendu cheque liaison serie peut 
eventuellement etre rdalis^e avec un nombre plus eievd de 
liens series. 

Dans le systeme multi processeur confo rme a 

15 I'invention, les moyens de communication d'adresses peuvent 
revetir essent iellement deux formes de realisation : en 
premier lieu, ils peuvent consister en un bus de communication 
parallele d'adresses de blocs (BUSA), commun a tous les 
processeurs (CPUj) et reliant ces derniers et la memoire 

20 centrale (RAM ) avec de facon classique un arbitre de bus (AB) 
adapts pour g^rer les conflits d'acces audit bus- II faut 
noter que ce bus d'adresses n'est utilise - que pour la 
communication des adresses de blocs : sur le plan de la 
structure, ce bus est identique au bus de communication 

25 parallele d'adresses des systemes connus, pour lequel ne se 
pose aucun probleme de saturation, puisqu'il peut etre lib<§re* 
aussitbt apres transfert de l'edresse de bloc. 

Toutefois, un autre mode de realisation de 
ces moyens de communication d'adresses peut §tre envisage dans 

30 le systeme mul t ipr ocesseu r de I'invention, consistent a 
exploiter les liaisons series de transfert des blocs 
d'informations (bi) pour transferer les adresses de ces blocs. 

Dans ce cas, un registre a ddcalage 
compiementaire (RDCj) est connects sur chaque liaison serie 

35 (LSj) en parallele avec le registre a decalage memoire 
correspondent (RDM j ) : les adresses transmises par ladite 
liaison serie sont ainsi chergees dans chacun de ces registres 
compiementaires (RDCj) ; un arbitre de gestion d'acces (ABM) 
relie auxdits registres (RDCj) et a la memoire centrale (RAM) 

AO est alors pr^vu pour preiever les adresses contenues dans 
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lesdits registrss et pour g£rer les conflits d'acces a la 
m^moire centrale (RAM). Un tel arbitre est de conception 
connue en elle-meme, ce type de conflits d'acces Stant 
5 maintenant r^solu depuis de nombreuses ann^es. Dans ce mode de 
realisation, on 6vite la presence d'un bus parallele de 
communication d'adresses, mais lea ressources en gestion aont 
alourdies. 

Par ailleurs, le systeme multi processeur 

10 conforme a I'invention est par ticuliferement bien adapts pour 
g6rer de fagon performante les problemes de coherence des 
donn^es partage*es entre processeurs de traitement. En effet, 
les solutions classiques pour g^rer ces donndes partagSes 
trouvent leur limite dans les systemes connus du fait du 

15 goulot d'e" tr anglement au niveau de la communication des 
informations, mais deviennent au contraire parfaitement 
satisf aisantes et perf ormantes dans le systeme de I'invention 
oCi un tel goulot n'existe plus, de sorte que ce systeme peut 
etre e*quipe* de moyens de gestion des donn^es partag6es de 

26 conception analogue a ceux des systemes connus. 

Par example, une solution tradi tionnelle de 
gestion des donn^es partage\es consiste a e"viter que celles-ci 
transitent par les m^moires-caches : de fagon classique, une 
logique de pa-rti.tion (LPj) est associe'e a chaque processeur 

25 de traitement (CPUj) en vue de diff^rencier les adresses des 
donnees partagSes et celles des donnles non partag^es de fagon 
a aiguiller les premieres directement vers la mdmoire 
centrale (RAM) et les secondes vers la m e" m o i r e-c a ch e 
correspondante (MCj). 

30 Dans une premiere version de I'architecture 

conforme a I'invention, le systeme comprend s 

• un bus special de communication parallele * 
de mots (BU5D) reliant les processeurs (CPU.) et la m6moire 
centrale (RAM), & 

35 • une logique de partition (LPj), associ^e a 

chaque processeur (CPUj) et adaptee pour diffdrencier les 
adresses des donnees partagSes et celles des donnees non 
pertag^es de fagon a transmettre celles-ci sur les moyens de 
communication d'adresses avec leur identification, 

40 • une logique de d<§codage (DEC) associde a la 
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m«§moire centrale (RAM) et adaptSe pour recevoir les adresses 
avec leur identification et aiguiller les donn<§es en sortie 
nnSmoire soit vers le registre b dgcalage mdmoire correspondan t 
5 ( RDM j ) pour les donnSes non partugSes, soit vers le bus 
special de communication de mots ( BUSD) pour les donnas 
par tag£es. 

Cette solution pr^sente l'avantage d'etre 
trfes simple sur le plan architectural ; la presence du bus 

10 special de communication parellfele (BUSD) conduit b de 
meilleures performances par rapport & une solution qui 
consisterait & utiliser les liaisons series pour transferer 
non seulement les blocs de donnas non partagSes mais 
regalement les mots de donnas partagdes, II est b noter que 

15 cette derniere solution peut, le cas SchSant, §tre envisagile 
en cas de faible taux de donnSes partagdes. ^ 

Dans une autre version, le systfeme est dots 
d'un bus special de communication parallfele de mots (BUSD) et 
d'un bus special commun de communication d'adresses de mots 

20 (BUSAM), reliant les processeurs (CPUj) et la mdmoire 
centrale (RAM). La logique de partition (LPj) aiguille les 
adresses des donndes partag^es vers le bus special commun 
(BUSAM) en vue du transfert des donnSes par le bus special de 
mots (BUSD), et aiguille les donndes non partage§es vers les 

25 moyens de communication d'adresses (que ceux-ci soient 
constituSs par un bus parallfele de communication ou que la 
communication s'effectue via les liaisons series). 

La presence d'un bus special de communication 
d'adresses de mots permet, dans cette version, de reculer la 

30 limite de saturation des moyens de communication d'adresses, 
en cas de demandes tllevges de donn€es partag<§es. 

Une autre version qui sera pr£f£ree en 
pratique dans le cas ou les moyens de communication d'adresses 
sont constituds par un bus parallfele de communication 

35 d'adresses (BUSA), consiste b <§quiper le systfeme d'un 
processeur de gestion m<§moire (PGM) associS b la melmoire (RAM) 
et d'un processeur espion de bus (PEj) associei b chaque 
processeur de traitement (CPUj) et au repertoire de gestion 
correspondant (RGj) ; le processeur de ges t i on m6 m o i re (PGM) 

AO et chaque processeur espion de bus (PEj), de structures 
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connues en soi, sont connect^s au bus de communication 
d'adresses (BUSA) en vue respec t i vement de surveiller et de 
traiter les adressea de blocs transmises sur ledit bus rie 
5 fagon h permettre une mise a jour de la m6moire centrale (RAM) 
et de la m6moire-cache associ^e ^ MC j^ en cas de detection 
d'une adresse de bloc prisente dans le repertoire associe" 
(R Gj ). 

Le processeur de gestion m£moire (PGM) et 

10 cheque processeur espion ( p Ej) associent des bits d'etat a 
cheque bloc d ! informations, les tiennent a jour en fonction de 
la nature (lecture ou ecriture) des demandes de bloc qui 
transitent sur le bus (BUSA) et assurent la coherence des 
donndes partagdes en utilisant ces bits d'etats qui leur 

15 permettent de forcer ou non l'ecriture d'un bloc en memoire 
centrale au moment des demandes sur le bus (BUSA). 

Dans le cas dvoque* pr£cedemment ou les 
communications d'adresses se font par les liaisons series, la 
gestion des donndes partagees peut egalement etre assurie de 

20 fagon centralist, par un processeur de gestion memoire (PGM) 
associe a la memoire centrale (RAM) et un processeur de 
maintien de la coherence des donnees partagees (PMCj) associe 
h cheque processeur de traitement (CPUj) et au repertoire de 
gestion correspondent (RG^), chaque processeur de maintien de 

25 coherence (PMCj) etant connects a un bus de synchronisation 
(SYNCHRO) pilots par le processeur de gestion memoire (PGM), 
de fagan b permettre une mise a jour de la memoire centrale 
(RAM) et de la memoire-cache associ6e (MCj) en cas de 
detection d'une adresse de bloc, une mise a jour de la memoire 

30 centrale (RAM) et des memoires-caches (MCj) a chaque 
prdlevement d'adresses dans les registres a decalage 
compiementaires (RDCj). 

Comme pr6c6 de m m en t , cette mise a jour est 
assur^e grace a des bits d'etat associds a chaque bloc 

35 d ' information par le processeur (PGM). 

II est a noter qu'un bus de synchronisation 
du type ci-dessus ddfini peut le cas Scheant £tre pr6vu sur 
l'archi tecture precedente ou les adresses de blocs transitent 
sur un bus commun d'adresses BUSA. Dans ce cas, les 

40 processeurs espions (PEi) sont sallicitds par le processeur de 
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gestion memoire (PGM) via le bus de synchronisation, et ce, 
uniquement lorsqu'ils sont concernes par le trsnsfert. On 
evite ainsi des acces inutiles vers les memoires-ceches ; les 
5 processeurs espions deviennent alors passifs -(puisque 
sollicites par le processeur PGM) et on les designers plutat 
par l'expression plus appropriee de "processeur de maintien de 
la coherence" selon Is terminologie ci-dessus utilisee. 

Une autre solution consiste a reserver le bus 
10 parallele de communication d'edresses (BUSA) au transfert des 
odresses des blocs de donnees partagees et b utiliser les 
liaisons adries pour le transfert des blocs de donnees non 
partagees. 

Par ailleurs, le systeme multi processeur 

15 conforme a l'invention se prete a des regr ouperoents de 
processeurs de traitement sur une meme liaison serie, de facon 
a limiter les liaisons series et les registres a decelage 
memoire correspondent ( RDM j ) ndceseaires . 

Le nombre de registres a dScalage memoire 

20 (RDM j) peut correspondre au nombre de liaisons series (LSj), 
auquel cas cheque registre a decalage memoire ( RDM j) est 
connecte de facon atatique a une liaison serie (LSj) 
sp6cif iquement affectee audit registre. 

Le nombre de registres & dScslage memoire 

25 (RDMj) peut egalement etre different de celui des liaisons- 
series (LSj) et notamment inferieur, auquel cas ces registres 
sont connects de facon dynamique aux liaisons series (LSj) 
par l'entremise d'un resesu d • interconnexion . 

Comrae dans les systemes classiques, la 

30 memoire centrale (RAM) peut §tre divisee en m bancs memoires 
(RAM j... RAM p ... RAM m ) agences en parallele. Cheque registre e 
decalage memoire (RDMj) est alors constitue de m registres 
elementaires (RDMjj... RDM jp ... RDM jm ) relies en parallele a 
la liaison serie correspondents (LSj). Cependant, un niveau de 

35 parallfi-lisme suppl<5mentaire et une meilleure adaptation 
electrique ou optique de la liaison sont obtenus dans une 
variante oil cheque bene memoire RAM p est relie a chaque 
processeur CPUj par une liaison serie en point a point LSj p . 

Par ailleurs, pour presenter des performances 

40 de transfert eu moins egsles a celles des systemes classiques 
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a bus parallels, le systeme conforms a l'invention est de 
preference synchronise par une horloge de frequence F au moins 
egale a 100 megahertz. Les registres a decalage memoire (RDMj) 
5 et registres a decalage procasseur (RDPj) peuvent tres 
simplement §tre d'un type adapte pour presenter une frequence 
de decalage au moins egale a F. * 

Dans le cas de trfes hautes frequences 
(notamment superieures h 500 megahertz avec la technologie , 

10 actuelle), on peut diviser ces registres en soue-registres de 
frequence de decalage plus faible, et les multiplexer. 

L'invention s*etend a un composant memoire 
multiport s6rie, susceptible d 1 equip er le systeme 
multiprocesseur precedemment defini, en vue d'en simplifier la 

15 fabrication. Ce composant, qui peut par ailleurs avoir des 
application© differentes, est constitue* par un circuit int£gre* 
comprenant une memoire a acces aieatoire (RAM) de largeur 
predeterminee correspondent a un bloc d'inf ormations (bi), un 
ensemble de registres a decalage (RDMj... RDMj..« RDM n ), 

20 chacun de capacity correspondent* a la largeur de la memoire, 
un bus parallele interne (BUSI) reliant I'acces de la memoire 
et les registres a decalage, une logique de selection d'un 
registre a decalage (LSR) adaptee pour valider la liaison sur 
le bus interne entre la memoire et un reqistre a decalage 

25 predetermine, et un ensemble de broches externes 
d 1 entree/sortie pour 1 1 entree d'adresses vers la 
memoire (RAM), pour l l entree d'adresses vers la logique de 
selection (LSR), pour l'entree et la validation de commandes 
de transfert en lecture ou ecriture d'un bloc 

30 d'informations (bi) entre la memoire (RAM) et les registres a 
decalage (RDM-), pour l'entree d'un signal d'horloge vers 
cheque registre a decalage (RDM j ) , pour l'entree bit a bit 
d'un bloc d'inf ormations (bi) vers chaque registre a decalage 
(RDMj) et pour la sortie bit a bit d'un bloc d'in format ions 5 

35 de chaque registre a decalage (RDM j). 

Ce composant peut §tre rendu parametrable par 

1'adjonction de registres de configuration (RCj^j RC2» 
permettant notamment un choix de taille des blocs 
d'inf ormations (bi) et de divers modes de f onct ionnement des 
40 registres a decalage. 
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L'invention ayant ete exposee dans sa forme 
g<5n<§rale eat illustree par la description qui suit en 
reference aux dessins annexes qui en presentent, a titre non 
5 limitatif, plusieurs modes de realisation ; sur ces dessins 
qui font partie integrante de la pr^sente description : 

- la figure 1 est un schema synoptique d'un 
premier mode de realisation du systeme mul t iproces seur 
conforme a 1 'invention, 

1q - la figure 2 est un diagramme donnant la 

courbe calcuiee de performance de ce systeme (A) et, a titre 
de comparaison, la' courbe (B) c o r r e s p o n d a n t e pour une 
architecture mul tiprocesseur conventionnelle h bus commun, 

- les figures 3, 4 et 5 sont des schemas 
15 logiques ddtaillds d'unites f onctionnelles du systeme de la 

figure 1, 

- la figure 6 est un schema synoptique d'un 
autre mode de realisation du systeme, 

- la figure 7 est un schema synoptique d'un 
20 systeme du type de celui de la figure 1, dote de moyens de 

gestion des donnees partagees, 

- la figure 8 est un schema logique detail 
d'un sous-ensemble du systeme de la figure 7, 

- la figure 9 est un schema synoptique d'un 
25 systeme analogue a celui de la figure 7 avec une variante de 

moyens de gestion de donnees partagees, 

- la figure 10 est un schema synoptique d'un 
systeme analogue, dote de moyens de gestion de donnees 
partagees differents, 

30' - les figures 11, 12a, 12b, 12c, 12d, 13, 14, 

15, 16, 17 sont des schemes logiques detailies d'unites 
fonctionnelles du systeme processeur de la figure 10, 

- la figure 18 est un schema synoptique d'un 
systeme du type de celui de la figure 6, dote de moyens de 

35 gestion de donnees partagees, 

- la figure 19 est un schema synoptique 
simplifie d'une variante de systeme, dans laquelle plusieurs 
unites centrales partagent un meme lien-serie, 

- la figure 20a est un schema synoptique d'un 
40 mode de realisation prefere, dans lequel la memoire centrale 
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est organised en plusieurs bancs memoires, 

- la figure 20b est une variante de 
1 1 architecture representee h la figure 20a, 

5 - les figures 21a et 21b sch^matisent une 

autre structure de memoire RAM susceptible d'equiper ledit 
systeme, fr 

- la figure 22 est un schema synoptique 
prSsentant la structure d'un composant m^moire multiport 

10 aerie, susceptible d'equiper le systeme* 

Le dispositif .presente sous forme de 
synoptique a la figure 1 est un systeme mul tiprocesseur 
possSdant n processeurs de traitement CPU^... CPUj... CPU n * 0n 
a represents h cette figure deux processeurs de traitement 

15 CPUj et CPUj avec leur logique associ€e. Chacun de ces 
processeurs de traitement est d'un type traditionnel par 
exemple "MOTOROLA 68020" ou "INTEL 80386"... et peut comporter 
des ressources locales en memoires et en interfaces 
pgriphdr iques et etre equipe d'un dispositif de memoire 

20 virtuelle. 

Le dispositif comprend une memoire centrale a 
acces aldatoire RAM r£alis£e de facon classique a partir de 
circuits integres memoires : en particulier RAM dynamique 
"INTEL" "NEC" "TOSHIBA"... de 256 Kbits, 1 Mbits, 4 Mbits... 

25 selon 1 f appl icet ion. Cette memoire est organis€e en blocs 
d'inf ormations bo... bi... de taille t dSterminee 
(habi tuellement 256 bits a 2 Kbits) et le front d'acces de 
ladite mdmoire correspond h la taille d'un bloc. 

La memoire centrale est relive en parallele a 

30 n registres a decalaqe RDM !«•• RDMj... RDM n dits registres- 
mdmoire, chaque registre-m emoire eyant la taille t d'un bloc 
d'inf ormations ; chacun de ces registres est realise en d 
technologie tres rapide ("ASGA") , un bloc pouvant etre charge 
ou decharge en un cycle de la memoire centrale RAM. Le nombre * 

35 n de registres est 6gal au nombre de processeurs CPUj. 

Par ailleurs, une memoir e-cache MCj est 
associee de f agon connue en soi a chaque processeur CPUj j 
chaque memoir e-cache est constitute de facon classique par une 
memoire rapide, a acces aieatoire, de faible capacite par 

40 rapport a la memoire centrale RAM. Un repertoire RG . et un 
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processes de qestion PGj sent de fagon traditionnelle relies 
a la memoire-cache et au processeur de traitement pour gerer 
lea informations transitant dans la nxSmoire-cache. 
5 En outre, dans le systems de l'invention, un 

registre a decalag* RDPj dit regiatre-processeur, est relie 
par son port perallele, a cheque ^moire-cache MCj j chaque 
regiatre-processeur RDPj est de taille correspondent a celle 
d'un bloc bi et de structure aimileire a celle des registres- 
10 memoire RDM j . 

Cheque registre-memoire RDMj est relie par 
son port serie, au port serie d'un registre-processeur ROPj 
par une liaison serie LS y Des exemples de realisation de 
cette liaison serie qui peut comporter un lien bidirectionnel 

15 ou deux liens unidirectionnels sont illustres aux figures 4 
et 5. Le contrBle du trensfert des blocs bi entre registres 
correspondents RDM j et RDPj est assure per des logiques.de 
trensfert TFRj et TFR'j qui sont eesociees de fagon symetrique 
au registre-memoire RDM j et eu regiatre-processeur RDPj ; un 

20 exemple de realisation de ces logiques de transfert (en elle- 
memes claasiques) est detaille h le figure 3. 

L'ensemble memoire centrele RAM, registrea b 
deceleges roemoires RD M ^ ... RDM n et logiques de trensfert 
associees TFRj ... TFR n constituent un ensemble fonctionnel 

25 denomme "memoire multiport eerie" M MS. L'ensemble proceaseur 
de traitement CPU jf memoire-ceche MCj, repertoire de gestion 
du cache RGj, processeur de gestion du cache PGj, registre a 
decelege proceaseur RDPj et logique de transfert assoeiee 
TFR'j constitue un ensemble "fonctionnel" denomme "unite 

30 centrele" UCj. 

Per ailleurs, le systeme comprend des moyens 
de communicstion d'adresses de blocs des processeurs CPUj vers 
la memoire centrele RAM, constitues en l'exemple par un bus 
commun de c o m m u n i c e t i on parallele BUSA aur lequel se 
35 connectent les processeurs CPUj (par l'entremiae de leur 
processeur de gestion PGj) et la memoire centrale RAM. 

L'eccfea au bus BUSA eet r«§glement<§ de fegon 

clessique par un arbitre de bus AB. 

Le f onctionnement general de 1 ' arch i t ec t u r e 

40 ci-dessus definie est le suivant : 
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Un processeur CPUj execute un programme 
propre constitue d'instructions, qui se trouvent sous forme de 
mots en mcmoire centrale RAM avec des extraits dans la 
5 mcmoire-cache associee MCj* Sur les instructions du programme, 
le processeur CPUj est amen© soit h lire des mots de donates 
qui elles-m©iries se trouvent dans la mcmoire centrale RAM ou 
dans la me moire-cache MCj sous forme ^extraits, soit h ©crire 
des mots de donnees dans la mcmoire centrale RAH et dans la 

10 racmoire-cache MCj, 

Chaque operation d'un processeur cr>u j 
(designee "demande") n©cessite la fourniture de 1'adresse adr 
du mot concern^, la nature r,w de l ! op6ration (lecture, 
ecriture) et l'echange (data) du mot concern^. 

15 Chaque demande de mot active le processeur 

PG * qui consults alors de fa con classique le repertoire du 
cache RG . lequel indique si le bloc bi contenant le mot 
concern^ est present dans la m6 mo ire-cache MCj et, le cas 
gcheant, le cadre de bloc dans la metnoire-cache oil se trouve 

20 le bloc recherche. 

Si le bloc bi contenant le mot concern^ est 
dans la m6moire-cache MCj, alors en cas de lecture ce mot est 
lu dans ladite mcmoire-cache et envoy© au processeur CPUj ; en 
cas d'ecriture le mot fourni par le processeur CPU. est ©crit 

w 

25 dans la mdmoire-cache s la transaction mcmoire est terminde. 

Si le bloc contenant le mot concern© n'est 
pas dans la m ©moire-cache MCj, alors une lecture de bloc bi en 
mcmoire centrale RAM est necessaire. Deux cas peuvent se 
produire . 

30 Premier cas 

La m©moire-cache MCj dispose d'au moins un 
emplacement de bloc libre, determine par le processeur PGj b 
l'aide de bits d'etats associ^s k chaque entree du 
repertoire RGj. Dans ce cas, le processeur PGj requiert, de 

35 fagon classique, le bus BUSA en soumettant sa demande h 
1'arbitre de bus AB. Ce dernier accorde, son tour venu, le bus 
BUSA au processeur PGj qui accede en lecture © la memoire 
centrale RAM, le bloc lu en mcmoire ©tant c h a r q © dans le 
registre RDMj, identifi© par I'origine j de l'appel. La fin du 

40 cycle de lecture se traduit par la liberation du bus BUSA et 
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l'activation du transfert avec la liaison sSrie LSj permettent 
de transferer le contenu du regist re-memoire RDM j dans le 
registre-processeur RDPj- La fin du transfert active 
5 recriture dans la memoire-cache MCj du contenu du registre- 
processeur dans l'emplacement de bloc reserve* a cet effet et 
la transaction peut se terminer comme pr£c£demment. 
Deuxieme cas 

La memoire-cache MCj ne dispose pas* 

10 d'emplacement de libre alors, par un algorithme classique, un 
emplacement de cache est rendu candidat pour recevoir le bloc 
demands Deux situations peuvent se rencontrer : 

- le bloc contenu dans 1 1 emplacement candidat 
n'a pas ete modi fie depuis son installation : il est 

15 simplement eiimine en liberant le cadre de bloc par une simple 
ecriture d'un bit d'etat dans le repertoire (RGj) et la 
transaction peut se poursuivre comme precedemment , 

• le bloc contenu dans ^emplacement candidat 
a ete modifie et une mise h jour de la meSmoire centrale RAM 

20 est ndcessaire. Pour ce faire, le processeur de gestion PGj 
transfere le bloc candidat dans le registre-processeur RDPj» 
active le transfert du registre-processeur RDPj au registre- 
memoire RDM j f puis requiert le bus commun BUSA en soumettant 
sa demande h I'arbitre AB. Lorsque 1'arbitre accorde le bus au 

25 proces.aeur de gestion PGj, ce dernier active une commande 
d'ecriture qui a pour effet de transferer le contenu du 
registre-memoire RDM j h son emplacement en mdmoire centrale 
RAM. La mise h jour memoire RAM est terminer et la transaction 
peut se poursuivre comme pr£c6demmen t. 

30 Ainsi, dans le dispositif de l'invention, les 

^changes entre les processeurs de traitement CPUj et leur 
memoire-cache MCj et 1 o g i q u e a a s s o c i 6 e s RGj , PGj , 
s'effectuent de fagon classique ; par centre, les transf erts 
de blocs entre memoire centrale RAM et m£moi re-caches MCj 

35 passent, non plus par un bus parallele commun mais par des 
liaisons-series LSj dediees b chaque processeur de traitement 
CPUj, le bus commun BUSA ne servant qu' au transf ert des 
adresses et ayant ainsi un trafic considerablement allege. 

On sait que, pour les architectures 

40 classiques b bus commun, une mode* 1 isat ion etudiee par "PATEL" 
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(analysis of multiprocessors with private cache, OANAK 

H. PATEL - IEEE Transactions on computers vol. C.31, N° 4 

APRIL 1982) a conduit h la forraule approchSe suivante donnant 

5 le rendement U en fonction du nombre de processeurs en 
presence : 

1 



1 + m (W+tf) 

10 ou 

le rendement U est le taux moyen d 1 utilisation de chaque 

processeur de traitement, 
m est la * probability pour qu'un processeur de traitement fasse 
une requ&te mSmoire, non pr^sente dans sa my moire-cache 
15 (cette probability m = p( .Pa est propor tionnelle h la 
probability d'absence Pa de I'inf ormation dans la m^moire- 
cache et h un facteur fonction de la puissance du 
processeur de traitement ramene* k un pourcentage de 
requites m£moire) f 
20 W est le temps moyen d'attente du bus commun, qui est fonction 
du nombre n de processeurs, 
tf est le temps de transfert d'un bloc de la mimoire 
centrale vers une my moire-cache. 

Les hypotheses b partir desquelles a yty 
25 ytablie cette formule montrent que celle-ci est applicable h 
1 1 ar ch i t e c t ure conforme h l'invention, avec un niveau 
d'approximation comparable au niveau d'approximation de la 
forraule pour des architectures classiques h bus commun. 

II est ainsi possible de comparer les 
30 performances des deux types d'archi tec t ure en supposant que 
les composants communs aux deux architectures sont de 
caractyristiques identiques. 

La figure 2 donne les courbes obtenues du 
rendement U en fonction du nombre n de processeurs pour les 
35 paramfetres suivants, les paramfetres communs aux deux 
dispositifs ytant identiques, et tous de valeur usuelle : 

- taille du bloc bi = 64 octets, 

- taille du mot pour le transfert parallfcle sur bus commun = 
4 octets, 
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- temps d'accfes mdmoire centrale RAM = 100 nanosecondes, 

- temps du cycle bus BUSA = 50 nanosecondes , 

- frequence de transfert sdrie = 500 Hhz, 

5 - probability d 1 absence Pa = 0,00 5 (me moire-cache de 
16 Koctets), 

- facteur de puissance des processeur3 : 0\ a 0,5. 

On constate en comparant lescourbes A 
(architecture de l f invent ion) et B (architecture classique) 

10 que l'architecture conforme h l'invention possfcde un rendement 
nettement sup^rieur b 1 ' architecture classique ; 
l'architecture de l'invention permet de tnettre en place un 
nombre de processeurs trfes supdrieur aux architectures 
classiques b bus commun qui en pratique ne peuvent ddpasser la 

15 dizaine de processeurs. Par exemple, dans le cas classique, un 
rendement de 0,75 est obtenu dfes le dizieme processeur, alors 
qu'il est obtenu pour plus de 80 processeurs dans le cas de 
1 * invention . 

La figure 3 pr^sente un mode de realisation 

20 d'une logique de transfert TFRj ou T F R 1 j permettant de 
transferer un bloc bi d' information d'un regis tre-m emoire RDM j 
vers un regist re-processeur RDPj (le transfert inverse ost 
assure par des moyens symetriques non representes b cette 
figure). Cheque logique TFRj ou T F R 1 j comporte une partie de 

25 contr&le de remission TFRE j et T F R E ' j et une partie de 
controle de la reception TFRRj et TFRR'j qui sont activ6es de 
facon croisee (emission TFRE j activde en synchronisme avec la 
reception TFRR'j). Le systfeme comporte un generateur d'horloge 
H dont la frequence fixe la vitesse de transmission et fournit 

30 le signal d'horloge h b la partie emission TFREj et h la 
partie reception TFRR'j. 

Dans la partie emission TFRE j un registre 
decompteur DC recevant par son entree de chargement load 2 le 
signal de lecture 7 du processeur de gestion PGj permet de 

35 laisser passer t + 1 impulsions d'horloge h 6 travers une 
porte logique ET 1 command^ par un signal de passaqe b zero 
"borrow", la sortie de cette porte ET1 etant reliee h l'entree. 
de decomptage "down" du decompteur DC et &.l"entree dp 
decalage shiftl du registre-memoire RDM j« 

^0 Dans la partie reception TFRR'j, une bascule 



SS0022002209 



WO 89/06013 PCT/FR88/00608 

20 

B est relive par son entree de donne*e D a la sortie s6rie du 
registre-processeur RDP j> l'entre'e horloge elk de cette 
bascule e"tar.t relive a l'horloge H pour recevoir le signal h. 
5 Un signal d r init ialisat ion "init" fourni par le processeur de 
gestion PGj est relae" a I'entrSe S de la bascule B et a 
l*entre*e de chargement load3 du registre-processeur RDPj* La 
sortie Q de la bascule transmet un signal de commande 
f in_transf ert h la porte logique ET2, permettant de laisser 

10 passer le signal d'horloge h vers l'entr^e de dScalage shift2 
du registre-processeur RDP j* Ce signal de cotnmande est 
ggalement de*livr6 vers le processeur de gestion PG j pour 
indiquer la fin de transfert de bloc* 

Le f onct i onnemen t de l'ensemble est le 

15 suivant : le processeur de gestion PGj, apres avoir obtenu 
l'acces a la mSmoire centrale RAM via le bus BU5A, effectue sa 
lecture de bloc bi en fournissant l'adresse du bloc concern^ 
et le signal de lecture r. Ce signal d6clenche l'activation de 
la partie Emission TFRE 1 : le front final du signal de lecture 

20 r provoque le chargement du bloc bi dans le registre-m£moire 
RDM j en activant le signal loadl et le chargement de la valeur 
t + l f correspondante a la taille en bits du bloc bi plus un 
bit suppl^mentaire dit de "start", dans le registre d<§compteur 
DC par le signal load2 ; ceci a pour effet de remettre a 1 le 

25 signal borrow et d'autoriser l'horloge de transfert H a 

fournir, a travers la porte logique ET1 conditionn£e par ce 

signal borrow, t + 1 impulsions d'horloge h : ces impulsions 

ont pour effet de dScaler par l'entr^e shiftl t + 1 bits du 

registre-m^moire RDM.- et de faire atteindre la valeur 0 par 

j ^^^^^ 

30 l'entre'e down au dScompteur DC : le signal borrow est remis a 
z§ro et verrouille le f onctionnement de la partie Emission 
TFRE r 

Ainsi, la liaison s6rie LSj, initialement a 
l^tat.repos logique 1, transmet le bit 0 dit de start, puis 
35 les t bits du bloc bi, et repasse ensuite a l'gtat repos 
logique 1, le dernier bit 6mis Stant la valeur 1 forc£e sur 
I'entr^e sSrie du registre-mSmoire RDMj- 

En prealable a la demande de lecture, le 
processeur de gestion PGj a initialise' la partie reception 
40 T F R R 1 • en activant le signal init qui a pour effet de charger 
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le registre-processeur RDPj avec t. bite a 1 par l'entree loed3 
et de mettre la sortie Q de la bascule B a l'etat logique 1 
par l'entrSe T. Cette sortie Q valide alors la porte logique 
5 ET 2 qui laisse passer le signal d'horloge h vers l'entree 
shift2 du registre-processeur RDPj. A chaque impulsion 
d'horloge ce registre-processeur fournit un bit sur sa sortie 
serie qui est memorise" dans la bascule B. Le premier bit 0 qui 
se prdsente a pour effet de mettre a zero la sortie Q de la 

10 bascule B et verrouiller le signal d'horloge h eur la porte 
ET2. Ce premier bit 0 etant le bit de start qui precede le 
bloc bi, ce dernier est done piegi§ dans le registre-processeur 
RDP • lorsque le processeur de gestion PGj est prevenu du 
cha J ngement d'etat de la bascule B par le signal 

15 fin_transfert : le processeur de gestion PG j n'a plus qu'a 
venir lire ce bloc bi sur le sortie parallele du 
registre RDPj. 

L'«§criture d'un bloc bi vers la memoire 
centrale RAM ntcessite la presence d'une logique TFRE'j, 
20 identique a la logique TFREj, associee au registre-processeur 
RDP • , et d'une logique TFRRj, identique a la logique TFRR'j, 
associee au registre-mdmoire RDM j. Dans ce cas, le signal init 
de la logique TFRRj est relie au signal d'ecriture w : la 
liberation du registre-m6moire RDM j rdarme automat iquement la 

25 loqique de reception TFRRj. 

Ce mode de realisation de la logique de 
contr&le du transfert n'est qu'un exemple possible : le 
registre emetteur peut etre en decalage permanent lui aussi, 
et le registre recepteur active pour t impulsions d'horloge 

30 sur detection du bit de start en debut de transfert . 

L'horloge H peut etre connects aux deux 
registres, ou deux horloges locales independantes peuvent etre 
utilisees, la synchronisation etant obtenue de fagon classique 
par un preambule dit de synchronisation. 

35 Le systfeme represente h la figure 4 comprend 

un registre a decalage memoire dedoubie RDM 1 j et RDM2 j , un 
registre a decalage processeur dedoubie RDPlj et RDP2 jt deux 
liens series unidirectionnels LSlj et L52j, l'un reliant le 
registre-memoire RDMlj au registre-processeur RDPlj de facon b 

40 transmettre le contenu du premier vers le second, l'autre 
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reliant le registre-mSmoire RDM2 j au registre-processeur RDP2j 
de fagon a trartsmettre le contenu du second vers le premier, 
et des logiques associSes pour le contrble du transfert : 
5 TFRElj pour RDMlj, TFRR2 j pour R DM 2 j , T FRE2 j pour RDP2j, 
TFRRlj pour RDPlj. 

Pour lire un bloc d'inf ormation bi en mdmoire 
centrale RAM, le processeur de gestion PGj initialise par le 
signal init la logique TFRRlj associSe au registre-processeur 

10 RDPlj puis active sa demande de lecture a la me'moire RAM par 
le signal de lecture 7. Ce signal active la logique TFRElj 
associ£e au r egist re-m£moire RDMlj : celle-ci assure le 
transfert sur le lien LSlj du bloc bi d'inf ormation. La fin du 
transfert est d6tect£e par la logique TFRRlj associde au 

15 registre-processeur RDPlj qui pr6vient le processeur de 
gestion PGj de 1'arrivde du bloc bi par le signal 
f in_transf er t. Le processeur de gestion PGj transfere alors le 
contenu du registre-processeur RDPlj dans la mdmoire- 
cache MC j . 

20 Pour dcrire. un bloc mimoire bi, le processeur 

de gestion PGj charge le registre-processeur RDP2j avec le 
bloc bi concern^ extrait de la me* moire-cache MCj f ce qui 
active le transfert de ce bloc sur le lien LS2j. La logique de 
transfert TFRR2j associde au regis tre-m6moire RDM2j assure la 

25 bonne reception de ce bloc. Le processeur de gestion PGj est 
prdvenu de la fin du transfert par le changement d'etat du 
signal borrow issu de la logique de transmission T F R E 2 j . Le 
processeur de gestion PGj effectue alors sa demande d'ecriture 
qui devient effective lors de l f activation du signal 

30 d'dcriture "w ; celui-ci a pour effet de transferer le contenu 
du registre RDM 2 j dans la mdmoire centrale RAM et de 
rdinitialiser pour un prochain transfert la logique TFRR2j. 

Ce dispositif autorise un transfert simultand 
. de blocs dans les deux sens et permet de traiter plus 

35 rapidement les d6fauts de blocs bi dans la mSmoire cache MC. 
lorsque cette derniere est saturde ; il autorise egalement la 
mise en place d'un mecanisme classique d 'anticipation de 
lecture de blocs. 

Dans un autre mode de realisation presents a 
40 la figure 5, la liaison LS * comprend un seul lien bi- 



SS0022002212 



WO 89/06013 PCT/FR88/00608 

23 

directionnel dote a cheque extremite d'une loqique de 
validation LVj et LV 2 constitute par une porte logique a 2 
entries a collecteur ouvert 0C 1 et QC 2 , I'une des entrees 
5 etant relive a la sortie s^rie du registre-memoire RDM j pour 
la porte OCj et du registre-processeur RDP j pour la porte 0C 2 , 
1'autre entree etant relive a la sortie 0 d'une bascule de 
commande BC^ et BC 2 ? chacune de celles-ci est relive par ses 
entries S et R 4 la logique de transfert TFR pour la bascule 
10 BC X et TFR ' pour la bascule BC 2 * 

Lectures et ecritures sont effectu^es de 
fagon exclusive, a la seule initiative du processeur de 
qestion PG j . 

Une lecture mSmoire active le signal de 
15 lecture *r qui provoque la mise a 1 de la bascule BC^ par son 
entree S*, la remise a zdro etant commandee, sur l'entrde R, 
par la logique de transfert TFR a la fin du transfert du bloc. 

Une Scriture mSmoire declenche un mdcanisme 
identique sur la logique de validation LV 2 « 
20 D'autres co m b i na i son s regis tres/1 iens sont 

possibles, et dans le cas d'un lien bi-direct ionel , on peut 
notamment utiliser des registres a decalage bi-directionnels 
recevant un signal de sens de transfert, Cette solution 
conduit a l'ut ilisa tion de registres a decalage plus complexes 
25 en logique, done a priori moins performants en vitesse de 
transfert. 

La vitesse de transfert devant etre tres 
eievee, les registres a d^calages RDM j et RDPj, leurs logiques 
de commandes associe*es TFR et TFR 1 , les logiques de 
30 validations LV 2 et LV 2 , sont choisis dans une technologie 
rapide (ECL, ASGA), et synchronises par une horloge de 
frequence F au moins egale a 100 MHr • 

Une autre solution a registres multiplexes 
presentee a la figure 21 permet, comme on le comprendra plus 
35 loin, de require consid#rablement la quantity de logique 
performante, done couteuse, n^cessaire. 

Le systeme mul t iprocesseur de la figure 1 
etait dot6, a la fois, d'un bus commun de communication 
d'adresses de bloc et de liaisons-series de transfert de 
AO donnees. La figure 6 prSsente, en variante, un systeme 
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mul tiprocesseur de meme principe g^n^ral , mais dans lequel 
donn^es et adresses transitent par les liaisons series, en 
I'absence de bus commun. 
5 Ce systeme comprend, en plus des registres- 

m^moires RDM-, des registres h dScalages comply men taires RDC . 
aptes a m£moriser les adresses des blocs demand£s et 
contr&lSs par une logique de type T T R j* En outre, un arbitre 
de gestion d'acces ABM est reli€ h la m^moire centrale RAM et 

10 aux registres complSmentaires RDCj par leur sortie parallele, 
Chaque logique TFR j est relive h cet arbitre ABM de structure 
classique. Le processeur de gestion PG . de chaque me'moire- 
cache MCj est reli6 h une partie de l'entree parallele du 
regist re-processeur en vue d'avoir acces a celui-ci en 

15 gcriture. 

Pour lire un bloc bi en m^moire centrale RAM, 
le processeur de gestion PGj place l'adresse du bloc demands 
et la nature de la demande (par un bit de prSfixe : 
1 s lecture, Qs Scriture) dans la partie qui lui est 

20 accessible du regist re-processeur RDP-, ce qui a pour effet 
d'initialiser le transfert de cette inf or tnation. La logique de 
transfert TFRj ddtecte la fin de transfert sur le registre 
compl^men taire RDCj et active une demande d'op£ration vers 
I'arbitre ABM ; celui-ci est charge de s^rialiser et de 

25 traiter les demandes de lecture de bloc en memoire centrale 
RAM en allant lire l'adresse du bloc demands dans le registre 
complgmen taire RDCj correspondent a la logique de transfert 
dlue par I'arbitre ABM, puis en allant lire le bloc en mimoire 
centrale RAM qui sera ensuite charge* dans le registre-m^moire 

30 RDMj et transmis comme pr€c6demment« 

Pour icrire un bloc en m€moire centrale RAM, 
le processeur de gestion PGj enchalne la transmission de 
l'adresse puis du bloc a £crire a travers le registre- 
processeur RDPj» Le registre com plSmentaire RDCj regoit ainsi 

35 tout d'abord l'adresse et la nature de la demande. 

La logique de transfert TFR j analyse cette 
demande et valide la reception du bloc dans le registre- 
m^moire RDM j du fait de la nature de la demande (£criture). La 
logique de transfert TFRj est pr£venue de la fin de transfert 

40 du bloc bi et transmet alors sa requ&te de service a I'arbitre 
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ABM. Cette demande est traitee, son tour venu, par ledit 
arbitre qui active l'ecriture du bloc bi en memoire. 

Par ailleurs, le systeme multiprocesseur 

5 represents a la figure 7 comprend des moyens de gestion des 
donnees pertagees, permettant de traiter, de facon statique, 
le problfeme classique du maintien de la coherence des donnees 
partagees. Ce systeme comprend les ressources du systeme de la 
. figure 1 (mines designations) avec les logiques et les 

10 ressources supplementaires suivantes s 

Un bus special de communication parallele de 
mots BUSD relie les processeurs CPUj et la memoire centrale 
RAM. Une logique de partition LPj est associee a cheque 
processeur CPUj ; cheque logique LPj est constitute de fagon 

15 classique par un ensemble de couples registres-comparateurs 
connectes en parallele sur le bus adresse adr du processeur 
CPU., en vue de reeliser une partition de l'espece memoire de 
la memoire centrele RAM en zone de donnees non partagees et de 
donnees partagees, ladite logique LPj delivrant h cet effet un 

20 signal p (indiquant Is nature des donnees, partagees ou non). 
Une logique de decodage DEC est associee a la memoire centrale 
RAM, elle-mime amenagee pour etre commandee en ecriture par 
mot ou par bloc par ladite logique DEC. 

La logique de decodage DEC est detaillee h la 

25 figure 8 et comporte un decodeur DECL, recevant sur son entree 
de donnee la partie adresse mot adrm de l'adresse adr, et 
relie par son entree de validation a la sortie d'une porte 
logique ET3, cheque sortie i dudit decodeur etant reliee h un 
"buffer" de validation de sortie BFSj. La porte logique ET 3 

30 recoit sur ses entries le signal p et le signal r invers<§. Un 
decodeur DECE est relie lui aussi par son entree de donnee au 
bus adrm, et par son entree de validation a la sortie d'une 
porte logique ET4, ses sorties etant reliees a un ensemble de 
portes logiques OUlj en nombre egal au nombre de mots dans un 

35 bloc. La porte logique ET4 regoit sur ses entrees le signal p 
et le signal w inverse. La sortie de la porte ETA est 
egalement reliee a un ensemble de "buffers" de validation 
d'entrees BFE^ , B FE La memoire centrale RAM peut fetre 
commandee en ecriture par mot. Cheque "tranche" mot ainsi 

40 definie a son entree de commande d'ecriture w £ . Le sortie de 
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cheque porte logique OUl^ est relive k I'entrSe * ^ de cheque 
"trenche" mot de la mtmoire centrale RAM. 

La figure 8 prtsente en outre le detail de 
5 1'sdressage des registres mtmoires RDMj, qui comprend en 
premier lieu un dtcodeur DECEB reliiS par son entree de donnde 
au bus commun BUSA, en vue de recevoir le n u m 6 r o j du 
processeur concern^ par la requ&te de l'unitt centrale UCj ; 
ce dtcodeur DECEB est relit par son entree de validation h la 

10 sortie d'une porte logique ET5 et par ses sorties 1, 2... j h 
des "buffers" de validation BVj, BVj... La porte logique ET5 
regoit sur ses entries les signaux p et w inverses. De mfeme, 
un dtcodeur DECLB est relie* par son entree de donnte au champ 
j du bus commun BUSA et par son entrte de validation h la 

15 sortie d'une porte logique ET6 $ les sorties 1, 2... j de ce 
dtcodeur DECLB sont relives aux entries de chargement Idj, ldj 
des registres h dtcalages mtmoire RDM y La porte logique ET6 
regoit sur ses entries les signaux p et r inverses. 

Le f onctionnement du systfeme est le suivant i. 

20 h cheque rtftrence mtmoire, le processeur CPUj fournit une 
adresse sur son bus adresse adr, et la nature de la requete : 
lecture "r ou tcriture w". II attend une donnte en cas de 
lecture et fournit une donnte en cas d'tcriture. L'adresse adr 
traverse la logique de partition LPj, laquelle indique, par le 

25 signal p, si l'adresse adr appartient h une zone de donndes 
non partagtes (p = 0) ou de donntes partagtes (p = 1). Dans le 
premier cas, la demande est aiguillte vers le processeur de 
gestion PGj et est traitte seion le mode de f one t ionnemen t 
dtcrit en rtftrence b la figure 1. Dans le second cas, la 

30 requite est directement aiguillte vers le bus commun BUSA ; le 
bus adresse adr comporte des fils supp It men taires d'adresse * 
permettant d'identifier le mot concern^ : l'adresse adr est 
constitute d'une partie adresse bloc adrb et d'une partie $ 
adresse mot adrm. Ainsi, aprfes accord de l'arbitre de bus AB, 

35 la mtmcire centrale RAM recoit soit une demande de transaction 
bloc (p s 0) et dans ce cas, seule la partie bloc adrb de 
1' adresse adr est significative, soit une demande de 
transaction mot (p = 1) et, dans ce cas, toute l'adresse adr 
(bloc adrb et mot adrm) est significative. 

40 En cas de lecture bloc, p = 0 et r = 0, la 
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porte logique ET6 valide le decodeur DECLB qui delivre un 
signal de chargement LDj sur le registre a decalage RDMj, 
permettant de charger dans ce dernier le bloc lu en memoire 
5 centrele RAM s l'adresse adrb par le signal de lecture r. 

En cas d'ecriture bloc, p a 0 et w = 0, la 
porte logique E T 5 valide le decodeur DECEB qui delivre un 
signal de validation sur le "buffer" BV Jt permettant au 
contenu de ce registre d'etre presente e la memoire centrals 
10 RAM et d'etre ainsi <§crit h l'adresse adrb, la sortie de la 
porte logique ET 5 fournissant le signal d'ecriture bloc. Ce 
dernier est diffuse sur les entries d'ecriture Wj, Wj, ... aux 
"tranches" mot de la memoire centrale RAM a travers les portes 
logiques OUlj. 

15 En ess de lecture mot, p = 1 et r = 0, la 

porte logique ET3 valide le decodeur DFCL qui delivre un 
signal de validation sur le "buffer" BFS i , permettsnt au mot 
demande (d'adresse adrm dans le bloc adrb) dont la lecture est 
assuree par le signal 7, d'etre aiguille vera le bus special 

20 de communication BUSD. Ce mot est recuper<§ directement par le 
processeur CPUj sur son entree de donnee data. 

En cas d'ecriture mot, p = 1 et w = 0, la 
porte logique ET4 valide le decodeur DECE qui fournit sur sa 
sortie i un signal aiguille h travers la porte logique OU^ 

25 vers l'entree d'ecriture u i de la "tranche" mot de la memoire 
centrale RAM concern^ ; ce signal present h l'entree w £ 
permet d'ecrire dans cette seule "tranche" mot le mot fourni 
par le processeur CPU j sur le bus de donn6e BUSD. Le contenu 
de ce bus est presente en parallele sur toutes les "tranches" 

30 root de la memoire centrale RAM, grace a une activation des 
"buffers" BFEj par le signal issu de la porte logique ETA. 

Une c a r a c te r i s t i qu e essentielle de 
l'architecture de l'invention est de presenter une charge 
minimale de requites sur le bus commun BUSA. Dans 

35 l'architecture schematisee h la figure 7, le bus commun BUSA 
est sollicite par des adresses de bloc et par des sdresses de 
root. La frequence des demandes en adresses de mot est fonction 
du taux de donnees partagees et peut conduire a une saturation 
du bus commun BUSA. 

40 La figure 9 presente en variante une solution 
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pour rtduire cette charge. Le systlme vise comprend, en plus 
des ressources de la figure 7, un bus BUSAM pour les adresses 
de mot, un arbitre AB" pour arbitrer les conflits d'accfes au 
5 bus BUSAM, un arbitre ABM charge d'arbitrer les conflits 
d'acces en provenance des bus BUSA et BUSAM, et reli6 a un 
multiplexeur MUX lui-mlme reli<§ par sea entries aux deux bus 
BUSA et BUSAM. 

Le fonctionnement de ce systfeme est le 
10 suivant : comme pr^c^demment, la logique de partition LPj 
fournit le signal p permettant d'identifier la nature des 
donnSes manipul^es. 

Si la demande concerne des donn^es non 
partag^es (p = 0), tout d£faut d 'inf orma t ion entralne une 
15 requite m^moire de type bloc qui transite par le bus commun 
BUSA. 

Si la demande concerne des donn£es partag^es 
(p .a 1), la requite est aiguill^e vers le bus commun BUSAM. 
Ainsi, la miSmoire centrale RAM peut recevoir des demandes 

20 simultan^es sur les deux bus BUSA et BUSAM, qui doivent done 
Itre arbitrSes. L'arbitre ABM alloue, de fagon classique, 
l'accls I la m^moire centrale RAM h l»une des deux requites et 
reconstitue le signal p I partir de I'origine de la demande 
(p s 0 pour BUSA, p = 1 pour BUSAM). Le signal p commands 

25 alors, d'une part, le multiplexeur MUX qui laisse passer les 
signaux du bus concern^ par la requite, d'autre part, la 
logique de d^codage DEC z on se retrouve dans la situation du 
systfeme precedent. 

On notera que la charge s'est d6plac£e du bus 

30 commun vers la m£moire centrale RAM, puisque le taux de 
requite au niveau de cette dernilre reste le mime et que son * 
temps de cycle est du mime ordre de grandeur ou mime suptrieur 
& celui du cycle bus. « 

Cette solution n'est done int6ressante que si 

35 la mdmoire centrale RAM est constitute de bancs m6moire 
centrale independents organises selon la description donnte 
plus loin en reference h la figure 20 : plusieurs transactions 
peuvent dans ce cas, si elles affectent diffgrents bancs 
mdmoires, avoir lieu sim ultantment . 

40 La figure 10 pr^sente un schema synoptique 
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d'un mode de realisation d'archi tecture conforme a 
^invention, dans lequel le probleme des donnees partagdes est 
traite de facon dynamique. A cet effet, le dispositif conforme 
5 a ce mode de realisation comporte un procesaeur espion de bus 
PE-, couple a un processeur de gestion du lien parallele PGPj. 
Un processeur de gestion du lien se\rie PGSj est li$ au 
processeur espion PEj par une file d'attente FIFOj. Un 
processeur de gestion de requetes de l'unite centrale PGUj est 

10 li<§, d'une part, au processeur de traitement CPUj, d'autre 
part, aux processeurs de gestion du lien parallele PGPj et de 
gestion du lien sSrie PGSj. La logique correspondent au 
processeur de gestion PGj de cheque memoire-cache est dans ce 
mode de realisation dclatee dans les divers processeurs 

15 pr6sentes ci-dessus. L'accfes a la memoire-cache MCj et a son 

repertoire RG - est reglementd par un processeur de gestion du 

j 

repertoire et du cache PGRj* 

Enfin, un processeur de gestion PGM de la 
memoire centrale RAM est connecte au bus BUSA et a la memoire 
20 centrale RAM, et a ses registres a d6caleges RDMj . 

Le f one t i onnem ent de l'ensemble est le 

suivant : 

Chaque transaction sur le bus commun BUSA 
correspond a une demande de lecture ou d'^criture de bloc bi. 

25 Les processeurs espions de bus PEj sont actives par chaque 
demande de lecture de bloc de donnees. Cette operation 
r<§alisee dans le meme cycle par tous les processeurs espions 
va permettre de garantir l'unicitd de valeur des donnees 
partagees. Le processeur espion PEj dispose d'un acces au 

30 repertoire RG j* La fonction duplication utilisee pour la 
gestion de la meSmoire-cache MCj est dans le mode de 
realisation decrit du type application directe. Chaque element 
du repertoire est un descripteur de bloc qui contient un champ 
"tag" (adresse du bloc), des bits classiques d'eltats du bloc : 

35 un bit de validation v et un bit de modification m et deux 
bits supple*mentaires a pour noter que le bloc est connu de la 
memoire-cache mais encore en cours de transfert sur la liaison 
serie, f pour indiquer que le bloc est dans la file d'attente 
PIFO et eviter ainsi qu'il y soit place plusieurs fois. 

40 Le processeur de qestion memoire PGM dispose, 
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d'une part, d'une file d'attente AFIFO d'adresses de blocs bi 
et d'adresses de processeurs, accessible de facon associative, 
d'autre part, d'un repertoire d'etat des blocs constitue de 
5 2 bits par bloc ro et rw indiquant les etats possibles de bloc 
suivant : 

. ro = rw =r 0 : bloc non encore diffuse, 
• ro = 1 | rw = 0 : bloc dejs diffuse* en 
lecture : une ou plusieurs copies de ce bloc se trouvent dans 9 
10 les mdraoires-caches, 

ro = 0 ; rw = 1 : bloc diffuse en 
ecriture : la copie h jour de ce bloc se trouve dans une 
, memoire-cache. 

L'evolution des bits d'etats de blocs est la 
15 suivante, differente selon la nature de la demande du 
processeur de traitement CPU- : 

- si le processeur CPUj fait une demande de 
lecture de don nee s non partag6es (espace programme ou de 
donnSes explicitement non partagees) : le bloc est marque d6jb 

20 diffuse en lecture (ro s 1 ; rw = 0) c6te memoire eentrale 
lors du transfert dudit bloc de la memoire eentrale RAM vers 
le registre RDM j et marque non modifie (m = 0) cote memoire- 
cache dans le meme cycle de tnise h jour du repertoire RGj de 
la me moire-cache (bloc valide)* Les espions n'ont pas rdagi b 

25 la requete sur le bus commun (la demande ayant 6t6 faite avec 
Vindication "donndes non partagees"). 

- si le processeur CPUj fait une demande de 
lecture de donn^es (a priori partagees), le bus commun BUSA 
est occupe" pour le temps du passage des informations 

30 d'adresses et de type de requite, le temps de leur traitement 
par le processeur PGM et les espions du bus commun PEj. En 
m^moire eentrale RAM, ce bloc peut §tre : * 

1. Non encore diffuse : ro = rw s 0. II 
est alors transmis a l'unite eentrale UCj et prend l'etat non * 

35 modifie, 

2. D£ja diffuse en lecture : ro s 1 ; 
rw s 0. II est alors transmis a 1'unite eentrale UCj. Son etat 
ne change pas, 

3. Deja diffuse en ecriture : ro = 0 ; 
AO rw = 1. La copie a jour de ce bloc se trouve dans une memoire- 
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cache MCj* Le processeur espion PEj associe a cette memoire- 
cache a note la demande de l'unite centrale UCj lors du 
passage de I'adresse sur le bus commun et a entrepris son 
5 transfert en memoire centrale RAM des que possible sur sa 
liaison sSrie LSj. En attendant son transfert effectif, le 
processeur de gestion memoire PGM met la demande en attente 
dans la file d'attente associative qui comports un nombre 
d'eiements egal au nombre de processeurs. 

10 Lors de la demande de lecture sur le bus 

commun BUSA, tous les processeurs espions PE. ont reagi en 
consultant le repertoire RG i associe a leur memoire-cache MC i . 
Le bus commun BUSA n'est 1 i b e r e que lorsque tous les 
processeurs espions PE£ ont eu leur accfes au repertoire de 

15 gestion R G . , ce qui garantit le m§me etat du bloc dans tout le 
systeme. Le processeur qui possede la copie a jour dans sa 
memoire-cache effectue dfes que sa liaison se"rie est libre, le 
transfert de ce bloc dans le registre RDM ^ et fait une demande 
d'ecriture de bloc sur le bus commun qui aura pour effet de 

20 lib^rer la demande en attente dans la file associative AFIFO 
et d'effectuer la mise a jour des bits d'etats du bloc. 

La mise a jour du bloc n ! a done ndcessit^ 
qu'une ecriture en mdmoire centrale RAM sans activation 
d 'espion. 

25 - si le processeur CPUj .demande 1'ecriture 

d'une donn^e dans un bloc present dans sa memoire-cache MCj 
avec I'etat non modifie, une demande d'ecriture informative 
doit etre emise sur le bus commun BUSA car il est possible que 
d'autres memoires-cache MCj. possedent ce bloc avec le meme 

30 etat. Ces eutres m^rooires doivent §tre informdes du changement 
d'etat. A cet effet, tous les processeurs espions PZ ± (actives 
par 1'ecriture informative diffused sur le bus commun BUSA) 
consultent leur repertoire de gestion RG i et invalident ce 
bloc, cependant que la memoire centrale note dans le meme 

35 temps le changement d'etat de ce bloc ainsi que le processeur 
de gestion parallele PGPj, dans le repertoire de gestion RCj. 
La liberation du bus commun BUSA par tous les processeurs 
espions et la memoire centrale RAM permet au processeur CPUj 
de realiser 1'ecriture dans sa memoire-cache MCjt la mise a 

40 jour du bit d'etat du repertoire de gestion RGj ayant ete 
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effective. 

Si une unite* centrale est en attente d'ecces 
au bus BUSA pour la mSme requete sup le mSme bloc, sa demande 
5 se transforme en Scriture simple et suit alors le protocols de 
demande de bloc en Scriture. 

- si le processeur CPUj demande l'£criture 
d'une donn€e dans un bloc absent de la m£moire-cache MC- t ce 
bloc est lu en mdmoire centrale RAM et amend dans la mSmoire- 
10 cache MCj pour que l'Scriture soit rendue effective. 

En mrfmoire centrale RAM, ce bloc peut §tre : 
1. Non encore diffuse" : ro = rw = o. Le 
bloc est alors Smis sur la liaison sdrie LS- vers la me*moire- 
cache MCj. II prend les <§tats ro = 0 ; rw = 1 en me*moire 
15 centrale et l^tat modifie\ (m r 1) dans la mdmoire-cache , 

2o Ddje diffuse* en lecture : ro = 1 ; 
rw = 0. Le bloc est 6mis sur la liaison s£rie LSj vers la 
m^moire-cache MCj. II prend les Stats ro = 0 ; rw = 1 en 
mSraoire centrale et 1'dtat modified ( m = 1) dans la mSmoire- 
20 cache. Lors de la demande sur le bus cotnmun BUSA, les 
processeurs espions PE £ ont note* la requete et invalids ce 
nume"ro de bloc dans leur m6moire-cache MC^, 

3. Ddja diffuse* en Scriture t ro = 0 ; 
rw s 1. La demande est mise dans la file d'attente associative 
25 AFIF0 et le bus commun BUSA est libe*re*. 

Le processeur espion PE i de le mdmoire-cache 
MC if ddtenteur de la copie a jour, active des que possible le 
transfert du bloc demande* de sa m^moire-cache MC i vers la 
mSmoire centrale RAM. Ce bloc est ensuite invalids dans la 
30 mSmoire-cache MC^, 

L'unite* centrale UCj fait une demande 
d'Scriture de mise a jour de bloc dans les deux cas suivants : 

a) la mSmoire-cache est sature*e et la purge 
d'un bloc nScessite la mise a jour de ce bloc en mSmoire 

35 centrale, 

b) une unite* centrale UC.^ est en attente d'un 
bloc dont la seule copie a jour se trouve dans la mSmcire- 
cache MCj. Le processeur espion PEj note la demande et realise 
des que possible la purge de ce bloc. 

40 Cote* mSmoire centrale RAM, chaque demande 
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d'ecriture de mise h jour entraine une consultation de la file 
d'attente associative AFIFO et, en cas de diScouverte d'une 
unite centrale UC i en attente de ce bloc, le chargement de ce 
5 bloc dans le regiatre h dScalage RDM i et la mise h jour des 
bits d'etats correspondent & ce bloc. C? type de demande 
d*ecriture ne sollicite done pas lea processeurs espions. 

Le processeur de gestion du repertoire PGRj 
qui est a j o u t e dans ce mode de realisation, perroet le 
10 deroulement de l'algorithme evoque ci-dessus, en coordonnant 
les accfes au repertoire de la n>e moire-cache MCj qui recoit des 
requites de trois unites f onctionnelles asynchrones t 

1. Le processeur de traitement CPU^, en vue 
de lire les instructions du programme en cours d'execution et 

15 de lire ou ecrire les donnees manipuiees par ce programme, 

2. Le bus commun BUSA, en vue de maintenir la 
coherence des donnees dans la memoire-cache MCjt 

3 . La liaison serie L S j , en vue de 
charger/decharger un bloc d'inf ormat ion de/vers la memoire 
20 centrale RAM. 

Chacune de ces requetes accfede au repertoire 
de gestion RGj de la memoire-cache. La serialisation de ces 
accfes sur ledit repertoire de gestion permet d ! assurer le bon 
f onctionnemen t de l'algorithme sus-evoque de coherence de 

25 l'inf ormation dans les memoires-caches. On obtient ainsi un 
couDlage fort des requetes au niveau du repertoire de gestion 
RG j mais la synchronisation qui doit exister au niveau du 
traitement de ces requites est suffisamment faible pour 
envisager un f onct ionnemen t asynchrone de la logique de 

30 traitement de ces requites, ce qui conduit au decoupage 
fonctionnel suivant ? 

L'interfece de cheque processeur CPU j et de 
ses auxiliaires (PGSj, PGUj) avec le bus commun BUSA est 
composee de deux parties ayant un f onctionnemen t mutuellement 

35 exclusif : le processeur de gestion du lien parallele PGPj est 
charge de requdrir le bus commun BUSA h la demande du 
processeur de gestion de requites PGUj ou du processeur de 
gestion du lien serie PGSj et de piloter le bus commun BUSA en 
ecriture. Le processeur espion de bus PEj assure la f onction 

40 d'espionnage, ce qui revient h piloter le bus commun BUSA en 
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lecture. II accede de facon fre*quente au repertoire RGj de la 

memoire-cache MCj* 

Le processeur de gestion du lien se*rie PGSj 

5 gere l'interface avec la liaison se*rie I Sj. II assure le 

chargement et le dechargement de blocs d 1 informations bi a la 

demande du processeur de gestion de requetes PGU . et du 

«j 

processeur espion de bus PEj. II accede de facon peu frequente 

a la m^ra oi re-cache MC* et au repertoire de gestion RG . 

J J 

10 correspondent. 

Le processeur de gestion de requetes PGUj 
assure le suivi des requites issues du processeur CPUj. II 
accede de facon tres f re*quente a la memoire-cache MCj et au 
repertoire de gestion RGj. Cette interface inclut l ! eventuelle 

15 logique de "MMU" ("Memory Management Unit") habituellemen t 
associee au processeur de traitement CPUj. 

Le processeur de gestion PGRj du repertoire 
de gestion RGj est I'arbitre charge d'allouer l'acces a la 
memoire-cache MC j . 

20 Les figures 11, 12, 13, 14, 15, 16 et 17 

representent a titre d'exemples des modes de realisation des 
diverses unites f onctionnelles du dispositif de la figure 10. 
Les designations des signaux ou entrees et sorties des unites 
sont choisies de facon habituelle. Les signaux de meme 

25 f onct ionnalite qui sont engendrds dans chaque unite 
f onctionnelle a partir d'un signal de base seront designes par 
la meme reference, par exemple : dnp s donnees non partagees, 
d 1 = demande de lecture, ma j = mise b jour, de = demande 
d'ecriture, ei = ecriture informative. Le dispositif possede 

30 piusieurs processeurs et I'indice j utilise jusqu'a present 
visait un processeur courant et ses auxiliaires ; pour alieger 
la description, cet indice a 6te omis sur ces figures et il 
est bien entendu que la description qui suit vise chacune des 
unites f onctionnelles qui se rattachent a chaque processeur de 

35 traitement. Par ailleurs, les signaux notes x_YZ definissent 
le nom et l^rigine du signal dans le cas ou YZ = RG, MC, UC, 
et la source et la destination du signal dans les autres cas, 
avec Y et Z representent r U = PGU, R = PGR, P = PGP ou PE, 
5 = PGS. 

40 La memoire-cache MC presentee a la figure 11 
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a par exemple une capacity de 16 K0. Elle eat organisde en 
16 modules de mdmoire vive rapide de 1 K0 MCq, ... MC 15 , 
chacun accessible sur un front de 4 octets : le bus adresse de 
5 la m^moire-cache MC (note* adr_MC) comporte une partie adresse 
de bloc adr_bloc et une partie adresse de mot dans le bloc 
adr_mot. Le bus adresse adr_MC est constitue* de 14 fils, 
permettant d'adresser les 16 K0 de la ro £ mo i r e- cac he MC. La 

* partie adr_bloc comporte 8 file permettant d'adresaer les 
10 256 emplacements de blocs de la mdmoire-cache MC, et la partie 

* adr_mot 6 fils permettant d'adresser un mot dans le bloc dont 
la taille est dans l'exemple de 64 octets. 

La partie adresse adr_bloc est relide a 
I'entrSe adresse de chacun des modules m^moires MCq... MCj^. 

15 La partie adresse mot adr_mot est. relive a l'entr^e de deux 
dScodeurs DECO et DEC1 (seuls les 4 bits de forts poids du bus 
adresse adr_mot sont utilises ; l'adresse est une adresse 
octet et le cache a une unite" d'acces qui est un mot de 
4 octets). Le signal de lecture 7_MC est d61ivr<§ a chacune des 

20 entries de lecture des modules m£moires MCq... M c i5 et & I'une 
des entries d'une porte logique 0U1. L'autre entree de cette 
porte logique 0U1 regoit le signal bloc inverse 1 . Le signal 
d'^criture w_MC est deUivre* a I'une des deux entries de portes 
logiques 0U2 et 0U3. La porte logique 0U2 regoit sur son autre 

25 entree le signal bloc inverse*. La porte logique 0U3 regoit sur 
son autre entree le signal bloc. La sortie de la porte logique 
0U1 est relive a l'entr£e de validation enl du ddcodeur DEC1, 
et la sortie de rang i de ce d^codeur DEC1 active un "buffer" 
de validation BVL de rang i. La sortie de la porte logique 0U2 

30 est relive a l'entree de validation enO du d6codeur DECO et a 
des "buffers" de validation BVE. La sortie de la porte logique 
0U3 est reliee a des portes logiques ETIq... ET1 15> qui 
regoivent sur leur autre entree la sortie de rang 
correspondent du d^codeur DECO. La sortie i de cheque porte 

35 logique ETIq... ET1 15 est relive a l'entr^e d'Scriture 
w^... vTj3 de chaque module mSmoire MCq... MC 15 . Un bus de 
donnSe relie chaque module m«§moire MCq.., MC i5 & I'un des 
buffers de validation BVL et a l'un des buffers de validation 
BVE. La sortie des buffers RVL et l'entr£e des buffers BVE 

40 regoivent en parallele un bus de donnSe datamot_MC (reli<§ au 



SS0022002225 



WO 89/06013 PCT/FR88/00608 

36 

processeur de gestion des requites PGU). 

Le f onctionnement de l'exeraple de la mSmoire- 
ceche ci-dessus dScrit est le suivant : 

5 

Cas 1 

. La demande provient du processeur de gestion 
du lien s6rie PGS. Ce cas est signale* par la presence d'un 
§tat logique zdro sur le signal bloc. 

10 En lecture me*moire-cache, le processeur de 

gestion du lien s«§rie PGS prSsente sur le bus adresse adr_MC 
l'adresse de 1' emplacement de bloc a lire (dans ce cas, seule 
la partie adr_bloc du bus adr_MC est utilised) et active le 
signal de lecture 7_MC. A I'issue des temps d'acces, le bloc 

15 est disponible sur le bus databloc_MC. 

En §criture m6mcire-cache, le processeur de 
gestion du lien sSrie pr£sente sur le bus adresse adr_MC 
l'adresse de 1' em placement du bloc a ^crire, sur le bus de 
donn^e databloc_MC la donnSe b y inscrire, et active la ligne 

20 w_MC. L'6tat ze*ro du signal bloc aiguille le siqnal w_MC vers 
les entries de commande d'£criture des modules de la m£moire- 
cache MC Q «.. MC 15 , via les portes logiques 0U3 et ETlj. 
L'inf ormation pre§sente sur le bus de donnSe databloc_MC est 
inscrite en mSmoi re-cache a I'issue du temps d'Scriture. 

25 Cas 2 

La demande provient du processeur de gestion 
de requete PGU du processeur de traitement CPU. Ce cas est 
signale* par la presence d'un Stat logique un sur le signal 
bloc» 

30 En lecture m ^moire-cache , le processeur de 

gestion PGU prdsente sur le bus adr_MC l'adresse du mot 
demande*, et active le signal de lecture T_MC. Le bloc 
correspondent h la partie adr_bloc est lu en me* moire-cache, et 
le mot demande* est aiguilld, via I'un des buffers de 

35 validation BVL, vers le bus de donn<§e datamot_MC« Le buffer de 
validation BVL concern^ est active* par la sortie du d£codeur 
DEC1 correspondant a l'adresse mot adr_mot demanded. 

En Scriture me*moire-cache , le processeur de 
gestion PGU prSsente sur le bus adr_MC l'adresse du mot a 

40 Scrire, sur le bus de donne*es datamot_MC la dbnn<§e a Scrire, 
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et active le signal d'ecriture w_MC. La donn^e pr^sente sur le 
bus datamot_MC est diffusee sur chaque module memoire-cache, 
via les buffers BVE valides par le signal d'^criture. Le 
5 signal d'ecri ture w_MC est ensuite presents au seul module 
memoire concern^. II est deiivre a la sortie du ddcodeur DECO 
correspondent a 1'adresse adr_mot concernee. 

Dans le mode de realisation ci-dessus decrit, 
les problemes d'acces en octet et double octet, et d'acces en 

10 double octet et mot a cheval sur deux modules memoires sont 
rdsolus de la m£me fagon que dans les systemes inf orma tiques 
t raditionnels et ne sont pas d^crits ici. 

Les figures 12a, 12b, 12c, 12d presentent, a 
titre d'exemple, les caracteris t iquea d'un repertoire de 

15 gestion du cache RG et d'un processeur de gestion associe 1 PGR. 
La figure 12a illustre la structure logique de 1'adresse 
adr_RG dans I'hypothese d'un espace d'adressage sur 32 bits et 
avec les caracteristiques de la memoire-cache d e c r i t e 
precedemment. Le champ -tag-, composante de 1'adresse bloc, 

20 est code sur 18 bits. Le champ -cadre- est code sur 8 bits et 
permet d'adresser les 256 emplacements de bloc de la memoire- 
cache MC. Les 6 derniers bits definissent 1'adresse mot dans 
le bloc, en unite octet. 

La figure 12b presente la structure du 

25 repertoire de gestion du cache RG, qui est une simple memoire 
rapide vive de 256 mots de 22 bits. Chaque mot d'adresse i 
contient le descripteur du bloc inscrit dens l'emplacement i 
de la memoire-cache . 

La figure 12c schematise la structure du 

30 descripteur qui comporte i 

- un champ tag de 18 bits, definissant 
1'adresse du bloc dans ^emplacement ou cadre de bloc courant, 

- le bit de validation v, 

- le bit de modification m, 

35 - le bit d'attente de fin de transfert a, 

- le bit d'attente de purge f. 

Ls figure 12d fournit la structure du 
processeur PGR, qui n'est autre qu'un arbitre classique avec 
priorite fixe. 

AO Cet arbitre comprend un reqistre LATCH, dont 
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trois entries recoivent respec t i vement des siqnaux rqst_UR, 
rq?t_PR, Fqsl_SR, Sgalement d^livr^s respectivement vers des 
partes logiques ET2, ET3, ET4. Les sorties corr espondantes du 
5 registre LATCH sont relives aux entries d f un encodeur de 
priority PRI, dont les sorties sont relives aux entries d'un 
d^codeur DECPRI. Les sorties de rang correspondent a ceux du 
regiatre LATCH sont relives aux signaux grnt_UR, grnt_PR, 
grnt_SR ainsi que, de facon inverse^, respectivement aux 
10 entries des portes logiques ET2, ET3, ET4. Les sorties des 
portes logiques ET2, ET3, ET4 sont relives aux entries de la 
porte logique N0U1. La sortie de la porte logique N0U1 est 
relive a une bascule Bl, qui regoit sur son entree D la sortie 
eO de I'encodeur de priority PRI. L'ensemble du" dlspositif est 
15 synchronise* par une horloge gdn£rale qui d£livre un signal h a 
l'une des entries elk d'une porte logique ET5 et, de facon 
invers«5e, sur I'entrSe horloge de la bascule Bl. La sortie Q 
de la bascule Bl est relieve h I'autre entree de la porte 
logique ET5. La sortie de la porte logique ET5 est relive a 
20 l'entree load du registre LATCH. 

Le f onctionnement de cet arbitre est le 
suivant : en l'absence de toute requete sur les lignes rqst, 
la bascule Bl memorise en permanence l'6tat de la ligne eO, 
inactive, et valide ainsi a trovers la porte logique ET5 le 
25 charqement du registre LATCH. 

L'arriv^e d'un signal rqst provoque le 
verrouillage de I'horloge et l'activation du signal grnt 
associe au signal rqst, jusqu'a deactivation de ce dernier : 
1'arbitre est fige" dans son £tat pendant toute la durde de la 
30 transaction en cours. 

Le processeur de gestion des requites PGU, 
represents a la figure 13, constitue une interface entre le * 
processeur de traitement CPU et : 

- d'une part, les divers processeurs avec * 
35 lesquels il doit echanger des informations : processeur de 

gestion parallele PGP, processeur de gestion se*rie PCS, 
processeur de gestion du repertoire du cache PGR, 

- d'autre part, le repertoire de gestion de 
la me~moire-cache RG et la m£moire-cache MC. 

40 Le processeur de traitement CPU declenche 
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l'activite du processeur de gestion des requites PCU en 
activant le signal as ("address strobe"). Ce signal valide le 
bus adresse adr_CPU, les signaux de lecture r_CPU et 
5 d'ecriture w_CPU ainsi que les-lignes fonction fc_CPU du 
processeur de traitement CPU. Le orocesseur de traitement CPU 
se met alors en attente jusqu'6 acquirement de la requete par 

le signal dtack_CPU. 

Le signal as est relit a l'entree d'un 

10 circuit differenciateur 010. La sortie de ce circuit est 
connectee a l'une des trois entrees d'une porte logique ET12, 
les deux autres entrees recevant respectivement des signaux 
aTk_US et acT<_UP. Ce dernier signal estjlgalement d<§livre a 
l'entree "r d'une bascule B13. L'entree S de la bascule B13 

15 regoit la sortie d'une porte logique NET10. La sortie de la 
porte logique ET12 est reliee & l'entree S d'une bascu le Bll, 
a l'entree t de la bascule BIO et a ljentree clearlO d'un 
registre a decalages SR10. La sortie Q de la bascule Bll 
fournit le signal rq~st_UR. La baacule Bll regoit sur son 

20 entree R la phase 813 inversee et la bascule BIO la phase 911 
inversee. La sortie Q de la bascule B 10 est reliee a l'entree 
serie serial_inl0 du registre SR10. Le registre a decalage 
SR10 regoit sur son entree clklO le signal horloge -h- et sur 
son entree de validation enTo le signal grntJJR. 

25 L'activation du signal as declenche le 

fonctionnement du circuit de di f f erenciat ion 010. L'impulsion 
produite par ce circuit traverse la porte logique ET12, metj» 
l'etat logique un les bsscules B10 et Bll par leur entree S, 
et effectue egelement la remise a zero du registre 6 decalage 

30 SR10 par son entree clearlO. 

La bascule B10 et le registre & dicalage SR10 
constituent le sous-ensemble logique "distributeur de phases" 
DP_U. L'activation de ce distributeur de phases est declenche> 
par la mise a un de la bascule B10 et la remise e zero du 

35 registre & decalage SR10. Si le regiatre a decalage est valide 
par la presence d'un niveau zero sur son entree enlO, alors la 
prochaine impulsion d'horloge h sur l'entree elk du registre a 
decalage produit le decalage d'un pas dudit registre. 

L'«Stat logique un de la bascule B10 est 

40 repercute sur le sortie 011 du registre a decalage SR10 par 
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son entree serie serialinlQ* La sortie 811, appelee phase 911, 
inversee, remet la bascule BIO a zero par son entree R. Ainsi, 
un bit unique est introduit dans le registre & ddcalages 5R10 
5 a cheque activation du distributeur de phases DP_U. A cheque 
impulsion d'horloge h, ce bit va ae d6caler dans le registre h 
decalage SR10 et produire les phases consScutives disjointes 
911, 912, 913. 

La mise a I'etat logique un de la bascule Bll 
10 provoque Pactivation du signal rqst_UR. Ce signal est dmis a 
destination du processeur de gestion du repertoire PGR. Ce 
dernier, dfes que possible, va accorder Tacces au repertoire 
de gestion RG et a la memoire-cache MC en activant le signal 
grnt_UR, qui va valider Tensemble des buffers de passage 
15 BV10, BV11 et BV12 situ6a r espec t i vement sur les bus du 
repertoire de gestion et sur les bus de la me mo ire-cache . Ce 
signal grrTt_UR valide egalement le distributeur de phases qui 
va done produire s6quentiellement les phases 911, 912, 813. 

La phase 811 correspond a une temporisat ion 
20 permettant de lire le descripteur du bloc demande par le 
processeur de traitement CPU dans le repertoire de gestion RG, 
adresse par le champ cadre de Tadresse adr_CPU et relie au 
bus adr_RG h travers des buffers de passage BV10. Le signal 
r_RG est toujours actif a I'entree d'un buffer BV10, le signal 
25 w_RG toujours inactif a l*entree d'un buffer BV10. A Tissue 
de la temporisation, le descripteur est retourne" au processeur 
PGU via le bus data_RG. La partie tag de ce descripteur et le 
bit de validation v sont d£livres & Tune des entries de 
comparaison d'un comparateur C0MP10, l'autre entree etant 
30 relive h la partie tag de Tadresse adr_CPU. Le bit en regard 
du bit de validation v est toujours a un. Le comparateur 
C0MP10 est valide en permanence par la presence d'un niveau un * 

sur son entree enll. 

Temps d'accfes au repertoire de gestion RG et ^ 
35 frequence d'horloge h sont en rapport tel, qu'a la fin de la 
phase 911, la sortie eglO du comparateur C0MP1O est 
positionnee et fournit 1 'in for m at i on ,f le bloc demande est 
present dans la memoire-cache ou absent de la memoire-cache". 

Si le bloc demande est present dans la 
40 memoire-cache MC (eglO = 1) alors le signal eglO, deiivre a 
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rune dea deux entrees de la porte logique ET10, fournit on 
signal calibre par la phase 812, presente sur 1'autre entree 

de la porte logique ET10. 
5 Ce signal calibre present sur la sortie de la 

porte logique ET10, est relie aux entries des portes logiques 

NET10, NET11, NET12. 

La porte logique NET10 regoit sur sea 

entrees, outre la sortie de la porte logique ET10, le bit 

10 inverse d'etat m issu du descripteur, et le signal inverse de 

demande d'ecriture w"_CPU. 

L' activation de la porte logique NET10 
correapond a l'etat "demande d'ecriture d'un mot dans un bloc 
present dens le cache et qui n'a pea encore ete modifie 

15 (m = 0)». La aortie de la porte logique NET10 est reliee a 
l'entree T d'une bascule 013. L'activation de la porte logique 
NET10 met la bascule B13 dans l'etat logique un, ce qui 
declenche une requite d'ecriture informative par la ligne 
F^Tt_UP au proceaseur de geetion du lien parallele PGP. 

20 L'adresse du bloc" concerne est fournie par les lignes 
adr_bloc_UP, deriv«§e des lignes adr_CPU. 

Le processeur de gestion des requetes PGU a 
termine la premiere partie de sa t&che : le repertoire de 
gestion RG et la memoire-cache sont libera par deactivation 

25 du signal 7qst_UR, consequence de l'arrivee de la phase 813 
inversee sur l'entree ¥ de la bascule Bll. 

Le mecaniame de l'ecriture informative est 
decrit au paragraphe "processeur de gestion du lien parallele 
PGP% et a pour effet de mettre le bloc demande dans l'etat 

30 modifie (m s 1) ou invalide (v = 0). On notera que la 
liberation du repertoire de gestion RG et de la memoire-cache 
MC par le procesaeur de gestion des requfetes PGU est 
neceaaaire afin que le processeur de gestion du lien parallele 
PGP puisse y avoir acces. La fin de ^operation "ecriture 

35 informative" est signalee au processeur de gestion des 
requfetea PGU par l'activation du siqnal ack_UP, qui a pour 
effet de remettre a zero la bascule B13 et d'activer, a 
travera la porte logique ET12, la bascule Bll et le 
distributeur de phases : le cycle initialement lancS par le 
40 signal 7i se reproduit, mais la sequence consequence de 
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l'activation de la porte NET10 ne se reproduira pas une 
seconde fois dans ce cycle de requSte. 

La porte logique NET11 recoit sur ses 
5 entries, outre la sortie de la porte logique ET10, le bit 
d'etat ro issu du descripteur, et le signal inverse de demande 
d'ecriture w"_CPU. z 

L'activation de la porte NET11 correspond a 
1'etat "demande d'ecriture dans un bloc present dans le cache ^ 
10 et qui a d«§je ete modifie". 

La sortie de la porte NET11 est reliee, a 
travers un des buffers BV11, au signal d'ecriture w_MC de la 
memoire-cache MC. Ce signal permet d'ecrire dans la memoire- 
cache, a l'adresse pr£sente sur le bus adr_MC, relie* au bus 
15 adr_CPU, via les buffers BV11, la donn6e presente sur le bus 
data_MC, relie au bus date_CPU via les buffers bidirectionnels 
BV12. Le sens d'activation de ces buffers est fourni par le 
signal w_MC. 

La sortie de la porte NET11 est egalement 
2fl relive a l'une des entries de la porte logique ET11, qui 
renvoie ainsi le signal dtack_CPU au procesaeur de traitement 
CPU. L'operation d'ecriture dans le cache se fait en parallele 
avec l'activation du signal dtack_CPL), ce qui est conforme aux 
specifications habituelles des processeurs de traitement. 
25 L'operation se termine par la liberation du 

repertoire de qestidn RG et de la memoire-cache MC par 
desactivation du signal rqst_UR, consequence de l'arrivee de 
la phase 613 inversee sur la bascule Bll. 

La porte logique NET12 regoit sur ses 
30 entrees, outre la sortie de la porte logique ET10, le signal 
inverse de demands de lecture T_CPU. L'activation de la porte 
logique NET12 correspond a l'etat "demande de lecture d'un mot 9 
dans un bloc present dans le cache". 

La suite des operations est identique a * 
35 l'operation precedente, a la seule difference du signal active 
(r_MC plut6t que vT_MC) associe au sens de transit des donnees 
sur les bus data_CPU et data_MC. 

Si le bloc demande est absent de la memoire- 
cache (eglO = 0), alors le signal eglO, inverse, relie a I'une 
.40 des deux entrees de la porte logique NET13, fournit un signal 
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calibre par la phase 012, presente sur l'eutre entree de la 
porte logique NET13. La sortie de la porte logique NET13 est 
reliee a l'entree S de la bascule B12. Ce signal calibre force 
5 la bascule B12 b u n, ce qui a pour effet d'emettre une requite 
de service rqstJJS vers le processeur de gestion du lien serie 
PGS. Ce processeur recoit egalement l'edresse du bloc a 
requerir sur les lignes adr_bloc_US et la nature de la requete 
sur les lignes w_US, r_US et fc_US. 

Le processeur de gestion des requetes PGU a 
termine la premiere partie de sa tache « le repertoire de 
gestion RG et la memoire-cache MC sent liberes par 
deactivation de la ligne rqst_UR, consequence de l'arrivee de 
la phase 013 inversee sur la bascule Bll. 
15 Le mecanisme de raise a jour du cache est 

decrit au paragraphe "processeur de gestion de la liaison- 
serie PGS". 



10 



On notera que la liberation du repertoire de 



gestion RG et de la me moire-cache MC est necessaire pour que 
20 le processeur de gestion de la liaison aerie PGS puisse y 
avoir acces. 

La raise a jour du cache est signalee au 
processeur de requite PGU par l'activation du signal ack_US. 
Ce signal est delivre a l'entrde R de la bascule B12 et h 

25 l'entrde de la porte ET12. II a ainsi pour effet de remettre a 
zdro la bascule B12 et d'activer a travers la porte loqique 
ET12, la bascule Bll et le diatributeur de phases : le cycle 
initialement lance par le signal a! se reproduit, mais cette 
fois avec succes du fait de la presence du bloc dans la 

30 memoire-cache . 

Le processeur de gestion serie PGS represente 
a titre d'exemple a la figure 14 est charge de gerer la 
liaison serie LS et a ce titre de realiser les demandes de 
transfert de blocs entre memoire centrale RAM et memoire-cache 

35 MC et de realiser les raises a jour correspondantes dans le 
repertoire de gestion RC. II traite en priorite les demandes 
issues du processeur espion PC en attente dans une file 
d'attente FIFO. II traite egalement les demandes issues du 
processeur de requites PGU. 

40 Ce processeur de gestion de la liaison serie 
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PQS comprend une bascule B20 qui recoit sur son entree de 
donne§e D le signal empty issu jie la file d'attente FIFO et sur 
son entree horloge la sortie Q d'une bascule B22. Une bascule 
5 B21 recoit sur son entree de donnee la sortie d ! une porte 
logique 0U20. Cette porte logique 0U20 valide le signal 
rqst_US, regu a l'une de ses deux entries, l'autre entree « 
6tant relive au signal empty. L'entriSe horloge de la bascule 
B21 provient de la sortie Q de la bascule B22. La sortie Q de ^ 
10 la bascule B22 est rebouclSe sur son entree de donnee D, ce 
qui la conditionne en diviseur par deux. L'entrSe d'horloge de 
la bascule B22 est connected a la sortie d'une porte logique 
ET20, laquelle recoit sur I'une de ses entries l'horloge 
ggnSrale de f one t ionnement h et sur l'autre entree un signal 
15 de validation. Ce signal de validation provient de la sortie 
d'une porte logique ET24, qui recoit r espect i vement sur ses 
deux entries les sorties Q et Q des bascules B20 et B21. ^ 

La bascule B20 recoit sur son entree R la 
phase 925, inverse^, issue d»un distributeur de phases DP_5. 
20 La bascule B21 recoit sur son entre'e "S la sortie d'une porte 
logique NOU20. Cette porte logique N0U20 recoit sur ses deux 
entries les sorties respectives de portes logiques ET22 et 
ET23. La porte logique ET22 recoit sur ses entries la phase 
825 issue du distributeur de phases et le signal maj issu 
25 d'une porte logique ET29. La porte logique ET23 recoit sur ses 
entries la phase 827 issue du distributeur de phases et le 
signal maj inverse^ 

L'ensemble des circuits B20, B21, B22, ET20, 
ET22, ET23, 0U20, ET24, N0U20 constitue un arb-itre a- priorite 
30 fixe ARB_S. Son f onctionnemen t est le suivant : la bascule B22 
fournit sur ses sorties U e t Q des siqnaux alternds de 
frequence moitie* de celle de l'horloge g6n6rale. Ces signaux ? 
valident alterna tivement les bascules B20 et B21. Si une 
requete de service est pr6sente sur l'une des entries des ? 
35 bascules B20 ou B21, alors ces signaux alternels mtimorisent la 
demande dans la bascule correspondents (B20 pour le processeur 
espion PE, B21 pour le processeur de gestion de requete PGU) 
qui, en retour, verrouille le f one t ionnem en t altern«§. On 
notera que le signal rqst_US en provenance du processeur de 
4B gestion de requetes PGU est conditionne" parole signal empty a 
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travers la porta 0U20 : ce signal n'est ainai pris en compte 
que 8i la file d'attente FIFO est vide. La bascule B20 
(respectivement B21) n'est remise a zero que lorsque la 

5 transection a effectuer est terminee. 

L'echentillonnage d'une demande sur Tune ou 
1-autre des bascules B20 et B21 se traduit par un changement 
d'etat de la sortie de la porte logique ET24. La sortie de la 
porte logique ET24 est egalement reliee a un circuit 

10 differenciateur D20 qui delivre une impulsion lors du 
ohangement d'etat da la sortie de la porte logique ET24. La 
sortie du circuit dif f erencisteur est reliee d'une part au 
distributeur de phases DP_S (entree S d'une bascule B36 et 
cT720 d'un registre a decalege SR20) du processeur de gestion 

15 de la liaison-aerie et d'autre part a 1'une des deux entrees 
de la porte logique 0U22. La sortie de la porte logique est 
reliee aux entrees S de deux_bascules B24 et B25. La bascule 
B24 recoit sur son entree R la sortie d'une porte logique 
N0U21 et la bascule B25 le signal grnt.SR. La porta logique 

20 N0U21 recoit sur ses deux entrees lea sorties de portaa 
logiques ET36 et ET37. La porte logique E36 regoit sur sea 
entrees la phase 923 issue du distributeur de phases et le 
signal mej, et la porte logique E37 la phase 927 issue du 
distributeur de phases et le signal maj inverse. 

25 L'impulsion issue du circuit differenciateur 

D20 initialise ainsi le distributeur de phases et met b l'etat 
logique un les bascules B24 et B25 a travers la parte 
logique 0U22. 

Le distributeur de phases DP_S est constitue 
30 du registre a decalages SR20 et de la bascule B36. Son 
fonctionnement est identique a celui decrit dsns le paragrephe 
concernant le processeur de gestion de requites PGU. 

Ls sortie Q de la bascule B24 est reliee au 
signal 7qTt_SR, h destination du processeur de gestion du 
35 repertoire PGR. Son activation declenche une demande de 
service a ce processeur, qui repond par la ligne grWt_SR, 
reliee a 1'entree R de la bascule B25. La sortie 0 de la 
bascule B25 est reliee a 1'une des entrees d'une porte 
logique 0U23. Le sortie de la porte logique 01)23 est reliee a 
40 1'entree en20 du registre a decalages SR20. 
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L'ensemble logique B24 et B25 constitue une 
logique de r a a y n c h r o n i a a t i o n RESYNC.S entre unitea 
aaynchronea. Son f onctionnement eat le aulva nt : 
5 une demande de service rqst_SR vers le 

procesaeur de geation do repertoire PGR ae fait par 
activation dea baacules B24 et B25 a travera la porte logique 
0U22, ce qui autorise deux origines d'activations. La logique 
propre au procesaeur de geation du repertoire PGR assure une 
10 reponae "g7n1:_SR dans un temps indetermine , qui remet a zero la 
bascule B25. La bascule B24 maintient sa demande jusqu'a sa 
remise & zero par activation de son entree "r. En retour, le 
procesaeur de geation du repertoire PGR defective sa ligne 
grnt_SR » la logique de re a y n c h r on i a a t i on est prete & 
15 fonctionner pour une prochaine demande de aervice. La aortie Q 
de la bascule B25 aert h bloquer le distributeur de phases par 
action aur son entree 5^20 via la porte logique 0U23 : la 
remiae a zero de la bascule B25 libere le distributeur de 
phaaea qui fournira la premiere phase 021 lora de la prochaine 
20 transition active de l'horloge generale h, connectee a 
l'entr^e clk20 du distributeur de phases. 

La liqne grnt_SR est eqalement relive aux 
buffers de validation BV20, BV25 et BV21, BV22 qui ouvrent 
l'accfes respectivement au repertoire de gestion RG et & la 
25 memoire-cache MC. 

Si la bascule B20 est active, alors la 
transaction en cours est une purge de bloc demandee par le 
processeur espion PE via la file d'attente FIFO. La sortie Q 
de la bascule B20 est reliee a des buffers de validation BV24. 

30 Ces buffers recoivent sur leur entree la sortie d'un registre 
REG20. La sortie o" de la baacule B20 est reliee a l'une des 
deux entrees d'une porte logique 0U21, qui recoit sur son 
autre entree la sortie du circuit dif f erenciateur D20. La 
sortie de la porte logique 0U21 est re liee & 1'entrSe load20 

35 du registre REG20 et h l'entree read20 de la file d'attente 
FIFO. 

Ainsi, l'activation de la bascule B20 

provoque : 

1. L'initialisation du distributeur de 

40 phases, 
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2. Une demande d'acces au repertoire de 
qestion RG et a la memoir e-CBChe MC, 

^ 3. Le chargement de l'element en tete de la 

5 file d'attente FIFO dans le registre REG20 et 1'evance de la 
file d'attente,: 

A. La validation du buffer BV24 : le bus 
adr.X contient 1'adresse du bloo a purger. La nature de 
^operation (miee a jour) sera retrouvee a partir de la 
10 combinaison des bits v et m (signal maj). 

Si la bascule B21 est active, alors la 
transaction en cours provient d-un defeut d' information dans 
la memoire-cache MC. La sortie Q de la bascule B21 est relies 
a des buffers de velidation BV23. Ces buffers regoivent sur 
15 leur entree les informations en provenance du processeur de 

gestion de requete PGU. 

Ainsi'l' activation de la bascule B21 

provoque : 

1. ^initialisation du distributeur de 

20 phases, . 

2. Une demande d'acces au repertoire de 

gestion RG et 6 la memoire-cache MC, 

3. La validation des buffers BV23 : le bus 
adr.X contient 1'adresse du bloc qui a provoque le defeut 

25 d'information dans la memoire-cache MC, et la nature de la 
requete : lecture ou ecriture, donnees partagees ou non 

partagees (lignes fc_US). 

Le champ "cadre" du bus adr_X est relie aux 
lignes d'adresses adr_RG du repertoire de gestion RG a travers 

30 des buffers de validation BV20. Les sorties Q_de bascule B26 
et B27 sont respecti vement reliees aux lignes r.RG et w_RG du 
repertoire de gestion a travers les buffers de validation 
BV20. La bascule B26 recoit sur son entree S la sortie de la 
porte logigue 0U22 et sur son entree R la phase 922 inversee 

35 issue du distributeur de phases. La bascule B27 regoit sur son 
entree 5 la sortie d'une porte logique N0U22 et sur son entree 
? la sortie d'une porte logique N0U23. La porte logique N0U22 
recoit sur ses deux entrees les sorties respectives de portes 
logiques ET25 et ET26, elles-memes recevant sur leurs entrees, 

40 pour la porte ET25 la phase 922 et le signal maj et pour la 



SS0022002237 



WO 89/06013 PCT/FR88/00608 

48 

porte ET26 la phase 626 et le signal maj. La porte logique 
N0U23 regoit sur ses deux entrees les sorties respectives de 
portes logiques ET27 et ET28, elles-memes recevant sur leurs 
5 entrees, pour la porte ET27 la phase 023 et le signal maj 
inverse et pour la porte ET28 la phase 827 et le signal maj 

inverse. ? 

Le champ tag du bus adr_"X est relii au champ 
tag deB lignes data_RG a travers des buffers de validation 
10 BV25. Ces derniers regoivent sur leur entree de validation la 
sortie d'une porte logique 0U24 qui regoit sur ses entries le 
signal grnt_SR et la sortie 0* de la bascule 827. 

Les entries D de bascules B28 et B29 sont 
respectivement reliies aux lignes bit de validation v et bit 
15 de modification m du bus data_RG. Les entries horloges de ces 
bascules B28 et B29 sont reliies & la phase 022 du 
distributeur de phases. La sortie Q de la bascule B28 et la 
sortie Q de la bascule B29 sont reliees aux deux entries d'une 
porte logique ET29, qui fournit sur sa sortie le signal maj. 
20 Une porte logique 0U25 regoit sur ses entries le signal msj et 
la sortie "q d'une bascule B30. La sortie de la porte 
logique 0U25 est reliie a. l'entrie de silection sel20 d'un 
multiplexeur MUX20, qui regoit sur ses deux entries de donnies 
la sortie Q de la bascule B28 (bit v) et la constante 0, la 
25 constante zero itant choisie lorsque l'entrie de silection 
sel20 est & l'itat logique un. La sortie du multiplexeur MUX20 
est reliie a la ligne bit de validation v du bus adr_X. La 
ligne bit d'attente -a- du bus adr_X est forcie & l'itat 
logique ziro. Le bit de modification -m- est relii a la ligne 
30 de lecture "r_adr_x du bus adr_X. 

L'ensemble logique dicrit ci-dessus constitue 
la logique d'accfes et de mise & jour du ripertoire de gestion 9 
RG. Son fonctionnement est le suivent : l'activation du signal 
g"rnt_SR, autorisant l'accfes su ripertoire de gestion et a la t 
35 miraoire-csche, valide les buffers de validation BV20. La 
lecture du descripteur concerni est commandie du dibut de 
l'autorisation d'acc&s jusqu'& l'arrivie de la phase 022, 
instant de mimorisation des bits -v- et -m- dens les bascules 
B28 et B29. L'itst combini de ces deux bits produit, h travers 
40 la porte logique ET29, le signal maj qui conditionne la suite 
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des operations. 

ler cas : maj = 1. Ce cas se produit lorsque le bit de 
validation est egal a 1 et le bit de modification est egal 
5 a 1. Ce cas correspond soit a une deir,ande de purge de bloc du 
processeur espion PE, soit a un defaut d'inf ormation constate 
par le processeur de gestion de requetes PGU sur un 
emplacement de bloc occupe et modifie : dans les deux cas, le 
bloc concerne doit etre Scrit en memoire centrale RAM. 
10 A cet effet, le champ -cadre- du bus adr_X 

est relie aux lignes adr_MC via les .buffers de validation 
BV21. Les sorties Q des bascules _B 3 0 et B31 sent 
respectivement reliees aux lignes 7_MC et w_MC de la memoire- 
cache MC, a travers les buffers de validation BV21. La ligne 
15 bTTc est forcee a zero via un des buffers de validation BV21. 
Les lignes de donnees data_MC de la memoire-cache sont 
reliees, via les buffers de validation bi-directionnels BV22, 
aux entrees du registre a decalage RDP et aux sorties des 
buffers de validation BV26, qui regoivent sur leurs entrees 
20 les liqnes de sortie du registre a_d6calage RDP. Les buffers 
BV22 sont valides par la ligne grnt_SR, et leur sens de 
validation commande par la sortie_Q de la bascule B31. La 
bascule B30 regoit sur ses entrees S et R respectivement les 
phases 021 et 023, inversees, en provenance du distributeur de 
25 phases. La bascule B31 regoit sur ses entrees S et R 
respectivement les sorties de portes loqiques ET32 et ET33. La 
porte logique ET32 regoit sur ses entrees la phase 026 et le 
signal maj inverse, la porte logique ET33 la phase 027 et le 
signal maj inverse. Une porte logique NET20 regoit sur ses 
30 entrees la phase 023 et le signal maj. La sortie d'une porte 
logique ET35 commande les buffers de validation BV26, et 
regoit sur ses deux entrees respectivement le signal maj 
inverse et la sortie 0 de la bascule B 31. La sortie de la 
porte logique NET20 est relije au signal load21 du registre a 
35 decalage RDP et a l'entree S d'une bascule B32. L'ent ree R de 
cette bascule B32 regoit le signal f in_transf ert.na j issu de 
la logique TFR associee au registre a decalage RDP. La sortie 
0 de la bascule B32 est reliee a l'une des entrees de la porte 
logique 0U23. 

40 L a loqique decrite ci-dessus permet de purqer 
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un bloc de la m e m o i re-cac he . Son f onct ionnemen t est le 
suivant : 

En parallele avec l'acces au repertoire de 
5 qestion RG, une lecture de la memoire-cache MC est active"e par 
la ligne 7_MC f issue de la bascule B30, durant les phases 821 
et 8 2 2. A l'issue de cette lecture, les donnees lu.es t t 
repr^sentant le bloc a decharger, sont presentes a l'entree du 
registre a dScalage RDM. L'activation du signal maj, dont s 
10 l'etat est connu en debut de la phase 622, provoque : 

1. L'invalidation du bloc dans le repertoire 
de gestion : l'entree sel20 du mul tiplexeur MUX20 etant a 
l'etat logique un, la valeur zero est forc^e sur le bit de 
validation, le descripteur etant 6crit dans le repertoire de 

15 gestion RG avec l'activation du signal "i7j*G, commandee par la 
bascule B27 durant le cycle 022, 

2. Le chargement du registre a d£calege RDM 
et l'activation du transfert, lors du passage de la phase 822 
a la phase 823, 

20 3. La mise h l'etat logique un de la bascule 

832, qui va bloquer le distributeur de phases sur la phase 823 
j u s q u 1 a la fin du transfert, sigriaiee par le signal 
f in_transf ert_maj issu de la logique TFR, 

4, La liberation du repertoire de gestion RG 

25 et de la m^moire-cache MC par remise a zero de la bascule B2A 
sur la phase 823 . 

Ainsi, l'acces au repertoire est libere (done 
accessible pour le processeur espion PE), le transfert de mise 
a jour est en cours, et le distributeur de phases bloque 
30 sur 823. 

Des que le transfert est termine, le bloc est 
en attente dans le registre a decalage RDM et il faut activer 
le processeur de gestion du lien parallele pour que 1'ecriture 
en memoirs centrale RAM soit effective. 

35 A cet effet, la bascule B33 est reliee par sa 

sortie Q a la liqne de requete de service rqstJP & 
destination du processeur de gestion du lien parallele PGP, La 
sortie Q est reliee a l'une des entries de la porte logique 
0U23, l'entree S~ a la phase 824 inversee du distributeur de 

40 phases et l'entree *R au signal ack_SP. Le bus adr_X est relie 
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au bus adr bloc_SP du processeur de qestion du lien perallele 
PGP. Une dea lignes du bus adr_bloc_SP revolt le signal maj 
afin d'indiquer la nature de la requite : mise a jour. 
5 Des liberation du diatributeur de phases par 

le signal f in.trensf ert_ma j , la prochaine transition active de 
l'horloge generale h provoque le passaqe de la phase 923 a la 
phase S24. La phaae 824 provoque une requite de service au 
proceaseur de gestion du lien parallele PGP (activation de la 

10 ligne Tqil.SP) et le blocage du distributeur de phases jusqu'a 
l'acquittement de la requite par le signal ack„SP. A ce 
moment, l'ecriture en mise a jour aura ete ef f ectivement 
realiaee par le proceaaeur de gestion du lien parallele PGP. 
Le diatributeur de phases, sur is prochaine transition active 

15 de l'horloge h, va passer de la phaae 924 a la phase 825. 

La mise b jour de la memoire centrale RAH est 
terminee : la bascule B20 est mise a zero par activation de 
son entree R" par la phase 825 inversee.J.a bascule 821 est 
mise k un par activation de son entree S par la phase 825, 

20 conditionnee par le signal maj au moyen de la porte logique 
ET22 via la porte logique N0U22. En cas de defaut 
d'information dans la memoire-cache, la purge d'un bloc ne 
constitue que la premiere partie de la requite : la demande 
7qTt_US est toujours presente, mais la liberation de la 

25 bascule B21 va permettre de prendre en compte d'e ventuelles 
demandes de mises & jour en attente dans la file d'attente 
FIFO. Des que le file d'attente FIFO est vide (empty = 0), 
tout le cycle decrit precedemment se reproduit, avec cette 
. fois le bit de validation & zero. On se retrouve alors dans le 

30 cas suivant. 

2feme cas : maj = 0. Ce cas se produit lorsque le bit de 
validation est egal a zero (par suite, peut-etre, d'une purge 
de bloc) ou lorsque le bit de validation est egel a un mais le 
bit de modification est egal e zero : la copie a jour de ce 

35 bloc est dej& en memoire centrele RAM. 

Ainsi, la requfete de service rqst_SR va 
entrsiner en retour un accord d'acces au repertoire de gestion 
RG et & la memoire-ceche HC avec lecture du descripteur, 
memorisation des bits m et v, generation du signal maj, 

40 reecriture du descripteur avec v = 0 (mej est h l'etat loqique 
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zero, la bascule B31 est a l'etet logique z6ro et sa sortie Q 
vaut done un, ce qui impose un signal logique a l'etat un sur 
l'entree sel20 du multiplexeur MUX20 et done force la 
5 constante 0) et liberation de l'acces au repertoire de gestion 
RG et de la me moire-cache MC. Ces operations sont effectives 
des activation de la phase 923. 

Le bloc demande doit maintenant etre lu dans 
la memoire centrale RAM. A cet effet, le signal maj inverse 
10 est'regu a l'une des entrees d'une porte loqique NET21, qui 
regoit sur son autre entree la phase 825. La sortie de la 
porte loqique NET21 est reliee aux entrees S des bascules B34 
et B35. La bascule B34 regoit sur son entree R le signal 
f in _ reception en provenance de la logique de transfert TFR. Sa 
15 sortie Q est reliee au circuit dif f erenciateur D21. Ce circuit 
est relie a la porte logique DU22. L'entree R de la bascule 
B35 est reliee au signal grnt_SR et la sortie Q a l'une des 
entrees de la porte logique 0U23. 

La lecture d'un bloc en m^moire centrale RAM 
20 et son transfert dans la mem oire-cache sont realises de la 
fagon suivante : la transition de la phase B23 a la phase 624 
declenche une requite de service au processeur de gestion du 
lien parallele par activation de la ligne rqst_SP, issue de la 
bascule B33. Le type d'operation est cette fois une lecture 
25 (r_adr_X = 0) ou une-ecriture (w_adr_X = 0) et le bus adr_X 
fournit l'adresse du bloc demande sur le bus adr_bloc_5P. Le 
distributeur de phases est bloque jusqu'a arrivee du siqnal 
d'acquittement ack_SP : la demande de lecture ou d'ecriture a 
ete faite a la memoire centrale RAM par le processeur de 
30 gestion du lien parallele PGP, et le bloc a ete en m§me temps 
valide et marque "en attente" par ce meme processeur. Le 
transfert est done en cours, de la memoire centrale RAM vers * 
le registre a decalage RDP. 

Le distributeur de phases, libere, fournit ? 
35 ensuite la phase 825. Cette phase, par l'intermediaire de la 
porte logique NET21 qui regoit sur son autre entree le siqnal 
maj inverse, va mettre a l'etat logique un les bascules B34 et 
B35. La bascule B35 bloque le distributeur de phases. La 
bascule B34 est remise a zero des arrivee du bloc demande dans 
40 le registre RDP, signaie par l'activation de la ligne 
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fin.reception issue de la logique de transfert TFR, ce qui 
declenche l'activation du circuit dif f erenci ateur D21 et une 
demande d'accfes au repertoire de gestio n RG et a la memoire- 
5 cache MC, par activation de la ligne rqst.SR issue de la 
bascule B2A. 

L'accord d'ecces, signale par la ligne 
gTnt_SR , libere le distributeur de phases par remise a zero 
des bascules B25 et B35 et ouvre l'acces au repertoire de 
10 qestion RG et a la me mo ire-cache MC. Le distributeur de 
phases, sur la prochaine transition active de l'horloge 
ggnerale h, fournit la phase 826. 

La bascule B27, reliee au signal w_RG du 
repertoire de gestion, est active de 926 & 827, ce qui permet 
15 de realiser la mise a jour du repertoire de qestion avec : 

- champ taq du bus data_RG = champ taq du bus 

edr_X , 

- bit de validite v = 1 (maj = 0 et la sortie 
Q de la bascule B31 est a zero : le multiplexeur MUX20 laisse 

20 passer v, qui a ete force a un par le proceaseur de gestion du 
lien parallele PGP, ou deje remis h zero par le processeur 
espion PE), 

- bit de modification m r etat de la ligne 
T_adr_X du bus adr_X (demande d'ecriture entraine m = 1, 

25 demande de lecture m = 0), 

- bit d'attente de transfert a s 0, 

- bit f = 0. _ 

La bascule B31 active le signal w_MC de la 
memoire-cache MC de 826 a 827, ce qui permet d'ecrire le 

30 contenu du registre a decalage RDM (lea buffers BV26 sent 
valides par la sortie T de la bascule B31 et le signal maj 
inverse) dans le bon emplacement (champ -cadre- du bus adr_X 
relie au bus adr_MC) de la memoire-cache, via lea buffers de 
validation BV22, commandes en sens de transfert par la 

35 bascule B31. 

A l'arrivee de la phase 827, la mise & jour 
du repertoire de gestion et de la memoire-cache est terminee. 
L'arrivee de la phase 827 provoque la remise h zero de la 
bascule B24, ce qui libere l'acces au repertoire de gestion RG 
40 et a la memoire-cache MC et l'activation de la sortie de la 
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porte logique ET23, remettant a un la bascule B21 et activant 
le signal Tck_US a destination du processeur de gestion des 
requetes PGU : la requite est terminer. 
5 Par ailleurs, le processeur espion PE est 

charge- du maintien de la coherence des donnSes dans la 
mSmoire-cache MC ; a titre d'exemple, on a represents a la 
figure 15 une architecture de ce processeur. Celui- ci est 
dgclenche* a cheque transition active du signal valid du bus 
10 commun BUSA. 

Si le signal valid est active" par un 
processeur de gestion du lien parallele PGP autre que celui 
assccie au processeur espion PE, alors la tache de ce dernier 
est la suivante, fonction du type de requete : 
15 _ requete en lecture de bloc de donndes non 

partag<§es ou requete d'Scriture de mise a jour du bloc : 
n£ant, 

- requete en lecture de bloc de donne*es 

partag£es : 

20 ♦ bloc absent : n6ant, 

. bloc present et non modifiS : n£ant, 
. bloc present et modifie* : demande de 
purge du bloc (que ce bloc soit present ou en cours de 
transfert de la m6moire centrale RAM yers la m ^moire-cache MC, 
25 6tat signale* par le bit -a- du descr ipteu r) , 

- requete en <§criture de bloc de donnees 

partagSes t 

• bloc absent : ne*ent, 

. bloc present non modifie* : invalider 

30 le bloc, 

. bloc present modifie* : demande de 
purge de bloc (m§me remarque que ci-dessus), 

- requete d f 6criture informative de bloc : 

• bloc absent : n6ant, 

35 . bloc present non modifie : invalider 

le bloc, 

. bloc present modifie* : cas impossible, 
~~ . si une demande d ! 6criture informative 

est eh attente sur ce meme bloc, elle est transformed en 
40 requete en <§criture de bloc, car ce bloc a «§te* invalids ; a 
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cet effet, la requite en cours est annulee et un acquirement 
est renvoye au processeur de gestion des requ&tes PGU. Ce 
dernier conaulte 1. repertoire RG et va trouver le bloc 
5 absent : une requite est emise vers le processeur de gestion 
PCS. Cette operation est prise en compte par le processeur de 

gestion perellele PGP. • 

Si le signal valid est active per le 
processeur de gestion du lien parallele PGP associe au 
10 processeur espion, alors la tache de ce dernier est Is 
suivante, fonction du type de requete (dite requete locale) : 

- requete en lecture de bloc de donnees non 
partagees ou requete d'ecriture de mise h jour de bloc : 
neant, 

15 - re quete en lecture de bloc de donnees 

partagees s marquer le bloc valide, en attente de transfert et 
non modifie ( v = a = 1 et m = 0 ) , 

- requete en ecriture de bloc de donnees 
partagees : marquer le bloc valide, en attente de transfert et 

20 modifie ( v = m = a = 1 ) , 

- requSte d'ecriture informative de bloc : 

marquer le bloc "modifie" (m s 1). 

Pour assurer les fonctions ci-dessus 
decrites, le processeur espion PE comprend un distributeur de 

25 phases DP_E, constitue d'un regiatre a decalage SRAO et d'une 
bascule B40. La sortie d'un circuit dif f erenciete ur CU P est 
reliee a l'entree "S de la bascule B40_et a 1'entree clearAO du 
registre SR40, ainsi qu'a l'entree S d'une bascule B41. La 
sortie Q de la bascule B40 est reliee a l'entree serial_in40 

30 du registre SR40. L'entree clk40 du registre SR40 r egoit le 
aignal h d'horloge generale et l'entree de validation en40 est 
reliee a la sortie Q de la bascule B43. La phase B41, 
inversee, issue du registre 5R40 est reliee a l'entree R de la 
bascule B40. 

35 Le fonctionnement du distributeur de pheses 

est conforme a la description faite dans le processeur de 

gestion des requetes PGU. ^ 

Le signal valid du bus BUSA est relie h 
l'entree du circuit differencieteur 040 et a l'entree de 
40 validation eT^l d'un decodeur DEC41. La bascule B41 recoit sur 
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son entrSe Fla sortie de la parte logique NQU40. La sortie Q 
de la bascule B41, a collecteur ouvert, est relive au signal 

done du bus BUSA. 

5 Les signaux valid et done assurent la 

synchronisation du processeur espion PE avec les autres 
procasseurs espions du systeme multiprocesseur : la transition 
negative du signal valid d«§clenche le circuit dif f <§renciateur j 
D40 qui produit une impulsion permettant d'ac ti ver le 

10 distributeur de phases et de nettre.le signal done a l'etat * 
logique z6ro par l'interm*§diaire de la bascule B41. La fin du 
travail de l'espion est signaled par un changement d'dtat sur 
la sortie de la porte logique N0U40, qui produit la mise a 
l'etat logique un du signal done par I'inter mSdiaire de la 

15 bascule B41. 

Le travail de l'espion est fonction de la 
nature do la demande et, a cet effet, le champ type du bus 
BUSA est connects a l'entree du de*codeur DEC41. Les sorties 
dnp et dmaj du d^codeur DEC41 sont reliees aux entrees d'une 

20 porte logique 0U40. Les sorties dl, de, dei du d^codeur DEC41 
sont relives aux entries d'une porte logique 0U41, les sorties 
de et dei 6tant Sgalement relives aux entrees d'une porte 
logique 0U42. La sortie de la porte logique 0U40 est relive a 
I'une des entries de la porte logique N0U40 par 

25 l'lnterrnddiaire d'une porte logique ET40, qui recoit sur son 
autre entree le siqnal 641. La sortie de la porte logique 0U41 
est relive respectivement a l'une des entries de portes 
logiques ET42, ET43, qui recoivent sur leur autre entrSe 
respectivement le signal de phase 041 et 844. Les sorties des 

30 portes logiques ET42 et ET43 sont relives respectivement aux 
entrees S et I d'une bascule B44. La sortie_de la porte 
logique ET42 est igalement reliee aux entrees S de bascules 
B42 et B43. Une porte logique N0U41 recoit sur ses entries le 
signal de phase 845 et la sortie d'une porte logique ET45, qui 

35 recoit sur ses deux entries la phase 844 et la sortie inversee 
d'une porte logique 0U43. La sortie de la porte logique^ N0U41 
est relive h I'entrSeTde la bascule B42. La sortie 0 de la 
bascule B42 est relive au signal rqst_PR et le signal grnt_PR 
est d<§livr6 & l'entrde *R de la bascule B43, aux entrees de 
40 validation de buffers de passage BV40, et a 1'une des entries 
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de la ports logique 0U44. _La porte logique 0U44 regoit sur son 
autre entree la sortie Q d'une bascule B45, et sa sortie 
valide les buffers de passage BV41. La sortie de la porte 
5 logique ET45 est egalement reliee a l'une des entrees de la 
porte logique N0U40 qui regoit sur une autre entree le signal 
de phase 845. La sortie de la porte logique 0U42 est reliee 
aux entrees de portes logiques ET46 et ET47, qui regoivent 
egalement sur leurs entrees la sortie d'une porte logique 0U43 
10 et respectivement les phases 944 et 645. La sortie Q de la 
bascule B44 delivre le signal r_RG via un buffer BV40,- la 
sortie Q de la bascule B45 delivre le signal w_RG via un 
buffer BV40. Le champ cadre du bus commun BUSA est relie au 
bus adr.RG via un buffer BV40. Le bus data„RG est relie aux 
15 sorties des buffers de validation BV41 et a 1'entree du 
registre REG40, qui regoit sur son entree load40 le signal de 
phase B43. La sortie du registre REG40 est reliee, pour la 
partie tag, aux entrees des buffers BV41 et a l'une des 
entrees d'un comparateur COMP40. Le comparateur C0MP40 regoit 
20 sur son autre entree la partie tag du bus BUSA. Le bit de 
validation v, issu du registre REG40, connecte au comparateur 
C0MP40 a en regard la valeur constante 1. Les bits v, a, m, f 
en sortie du registre REG40 sont relies respectivement a l'une 
des entrees des multiplexeurs MUX40 , MUX41, MUX42, MUX43. Les 
25 sorties de ces multiplexeurs fournissent l'etat de ces memes 
bits a 1'entree des buffers BV41. Le multiplexeur MUX40 regoit 
sur ses autres entrees les constantes zero et un, les entrees 
8 el40 sont reliees a la sortie d'une porte logique ET48 et a. 
un signal dTl^. Le multiplexeur MUX41 regoit sur son autre 
30 entree la constante un, selectee lorsque son entree sel41, 
recevant un siqnal dlle issu du processeur de gestion PGP, est 
a l'etat logique un. Le multiplexeur MUX42 regoit sur ses 
autres entrees la constante un et le s ignal 7_adrbloc_SR, ses 
entrees sel42 regoivent les siqnaux dlei et dlle issue du 
35 processeur de gestion PGP. Le multiplexeur HUX43 regoit sur 
son autre entree la constante un, selectee lorsque son entree 
sel43, reliee h la sortie d'une porte logique ET49, est h 
l'etat logique un. La porte logique ET49 regoit sur ses 
entrees la sortie eq40 du comparateur C0MP40, le signal f 
40 inverse et le signal m. La porte logique ET48 regoit sur ses 
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entries la sortie eg4G, le siqnal m inverse, le signal dlei et 
la sortie de la porte logique 0U42. La porte logique 0U43 
regoit sur l'une de ses entrees le signal eg40, et sur son 
5 autre entree le signal dlle. La sortie de la porte logique 
ET49 est egalement reliee t l'entree load41 de la file 
d'attente FIFO, deja decrite dans le processeur de gestion du 
lien serie PCS. Les champs cadre et tag du bus BUSA son t 
relies a l'entree de la file d'attente FIFO. Les signaux dlei, 
10 dTTe et 7_adrbloc_SP proviennent du processeur de gestion du 
lien parallfele PGP, qui regoit par ailleurs le signal del du 
decodeur DEC41. 

Le f onctionnement de l'enseroble est le 
suivant : l'activation du signal valid initialise le 
15 distributeur de phases DP_E et valide le decodeur DEC41 qui 
produit l'activation d'une sortie fonction de l'information 
type codant la nature de la demande en cours sur le bus commun 
BUSA. La sortie active peut etre ! 

- dnp : requete en lecture de donn^es non 
20 partaqees. Le signal "dolTi est dfisactive a l'apperition de la 

phase 041 ; 

- dmaj : requete d'ecriture de raise a jour de 
bloc. Le signal done est desactive a la phase 641 ; 

- dl s requete de lecture de bloc ; 
25 - de : requite d'ecriture de bloc ; 

- dei : requ&te d'ecriture informative. 

Ces trois cas necessitent un acces en lecture 
au repertoire RG, et les deux derniers une reecriture 
eventuelle du repertoire. A cet effet, une requite d'acces est 

30 emise vers le processeur de qestion du repertoire PGR par la 
bascule B42 (signal rqst_HR), la bascule B43 inhibant le 
distributeur de phases jusqu'a accord d'acces, signifie par le 
signal grnt_PR. La lecture s'effectue done de 941 6 044 
(bascule B44) et l'eventuelle ecriture de 044 a 045 (bascule 

35 B45) avec memorisation du descripteur dans le registre REG40 
lors de la phase 643. Si le bloc e st ab sent de la memoire- 
cache MC (eg40 = 0), alors le signal done est desactive sur la 
phase 044. Si le bloc est present dans le cache (eg40 s 1), 
alors : 

40 - si m = 1, une demande de purge est activee 
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soit pas dejft dans la file (f - 0) , le seul bit modifie est 
f mis a un, lors de la reecriture du descripteur, 

. si m - o, le bloc est invalide par le 
multipleveur MUX40 (activation de la porte logique__ET48), 

- si la demande est locale (dlle ou dlei 

actif), alors : 

1) en cas de lecture ou d'ecriture, les 
10 bits v et a sont mis ft ljt m est mis ft 0 (lecture) ou 1 

(ecriture) (etat du signal T_adrbloc_SP ) , 

2) en cas d'ecriture informative, le bit 

m est force ft 1. 

Dans ces derniers cas qui demandent une 
15 reecriture dans le repertoire de gestion RG, le signal done 
est desactive sur la phaae 945, 

Le processeur de gestion du lien parallels 
PGP, dont un exemple est represents ft la figure 16, est charge 
de requerir le bus commun BUSA et de realiser la transaction 
20 demandee, soit par le processeur de gestion des requites PGU, 
soit par le processeur de geation de la liaison serie PCS. 

Une demande issue du processeur de gestion 
des requetes PGU ne peut etre qu'une requete d'ecriture 
informative. Une demande issue du processeur de gestion de la 
25 liaison serie PGS est, soit une demande de lecture ou 
d'ecriture de bloc, soit une demande de mise ft jour de bloc. 

Le processeur de gestion du lien parallele 
PGP comprend une bascule B60, reliee per son entree de donnee 
D au signal TqTt.UP. Une bascule B61 est reliee par son_ entree . 
30 de donnee D au signal rqst.SP. Les sorties Q et Q d'une 
bascule B62 sont reliees respect ivement aux entrees horloges 
des bascules B60 et B61. La sortie 0 de la bascule B62 est 
rebouclee sur son entree de donnee. Les sorties Q des bascules 
B60 et B61 sont reliees aux entrees d'une porte logique 0U60. 
35 La sortie de la porte logique 0U60 est reliee, d'une part, ft 
un circuit di f f erencia teur D60, d'autre part et de fa«?on 
inversee, ft une entree d'une porte logique ET60, qui recoil 
sur son autre entree le signel d'horloge gendrale h. La sortie 
de la porte logique ET60 est reliee ft l'entree horloge de la 
40 bascule B62. La sortie du circuit dif f erenci ateur D60 est 



SS0022002249 



WO 89/06013 PCT/FR88/00608 

60 

reliee a l'entr<§e s" d'une bascule B63. La sortie Q de la 
bascule B63 ddlivre un signal rqsti a destination de 1'arbitre 
AB, et son entrSe R est relive a la sortie d'une porte logique 
5 ET62. Le signal grnti issu de 1'arbitre AB est reli<§ a des 
portes logiques 0J62 et N0U60 , La p orte logique 0U62 resoit 
sur son autre entree le signal valid inverse^ et sa sortie est 
relive a l'entr<§e d'un circuit dif f Srenciateur D61. La sortie 
de ce circuit D61 est relive h l'une des entries de la porte 
10 logique ET62 et a I'entrSe 7 d'une bascule B64. La sortie Q de 
cette bascule B64 est relive a 1'entrSe de validation de 
buffers de passage BV60 et de facon invers^e, a travers un 
inverseur a collecteur ouvert 160, au signal valid. Le signal 
done est reliS a l'entr^e d'un circuit dif f erenciateur D62. La 
15 sortie de ce circuit D62 est relive a l'entr<§e R de la bascule 
B64 et a l'une des entries de la porte logique NQU6Q* La 
sortie de cette porte logique N0U60 est reliSe a l'une des 
entries de portes logiques NET 60 et NET 61 , qu ij-egoi ven t sur 
leur autre entree, respectivement les sorties Q des bascules 
20 B60 et B61. Les sorties T} des bascules B60 et B61 sont 
6galement relives respectivement aux entries de validation des 
buffers de passage BV61 et BV62. La sortie de la porte logique 
NET 60 est reliee, d'une part, a l'entr<§e 5 de la bascule B60, 
d'autre part, h l'une des entries d'une porte logique ET63, 
25 qui regoit sur son autre entr6e la sortie d'un circuit 
dif f Erenciateur D63. La sortie de la porte logique ET63 
d£livre le signal acq_l!P vers le processeur de gestion PGU. La 
sortie de la porte loqique NET61 e st r elive a l'entr£e S de la 
bascule B61 et fournit le signal ack_SP. Le bus adr_bloc_UP 
30 est relie" a l'entr<§e des buffers de validation BV61 et a I'une 
des entries d'un comparateur C0MP60. 

Le bus adr_bloc_SP est reliS a l'entrSe des 
buffers de validation BV62. Les sorties des buffers BV61 et 
BV62 sont relives ensemble et a l'entrSe des buffers de 
35 validation BV60. La sortie des buffers BV60 est reliee au bus 
commun BU5A. Des portes logiques 0U63 _et 0U64 resolvent sur 
leurs entrees respectives les sorties Q des bascules B60 et 
B61, le signal logique grnti et le siqnal maj po ur 0 U64. La 
sortie de la porte logique 0U63 ddlivre le siqnal dlei, et la 
40 sortie de la porte logique 0U64 le signal dlle. L'autre entree 
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du comparateur C0MP60 recoit les champs tag et cadre du bus 
commun BUSA. L'entree en60 du comparateur C0MP60 est reliee a 
la sortie de la porte loqique ET61, qui recoit sur sesjntrees 
5 le signal "gT^i inverse, le signal dei et le signal rqst.UP 
inverse. La sortie eg60 du comparateur C0MP60 est reliee a 
l'entree du circuit d i f f erenc ia teur D63. La sortie de ce 
circuit est egalement reliee aux entrees R des bascules B60 et 
B61 et a l'autre entree de la porte logique ET62. 
1Q Le f onctionnement de l'ensemble est le 

suivant : 

Les bascules B60, B61 et B62 associees aux 
portes logiques ET60 et 0U60 constituent un arbitre local. Cet 
arbitre examine alternativement les requetes rqst.UP et 
15 7c7t_SP, et les reperc ute vers l'arbitre AB du bus commun BUSA 
par le signal rqsti. L'acco rd d'acces est fourni par la 
validation du signal grn ti et le cycle bus a lieu des 
deactivation du signal valid qui libere l'arbitre AB. 
L'activation du signal d^Te libere l'arbitre local : la 

20 transaction est terminee. 

Si le requite provient du proces seur de 
qestion de la liaison serie PGS, alors les signaux dlei et 
d7T7 indiquent au processeur espion PE associe la nature de le 
mise a jour des bits d'etats du bloc a effectuer dans le 

25 repertoire RG. 

Si le requete provient du processeur de 
gestion des requetes PGU, alors en cas de detection d'ecriture 
informative sur le meme bloc (signal dei en provenance du 
processeur espion PE), une liberation immediate a lieu : le 

30 processeur de gestion des requetes PGU, apres consultation du 
repertoire (le bloc a ete invalide) aiquillera sa demande vers 
le processeur de gestion de la liaison serie PGS. 

Le processeur de gestion memoire PGM dont un 
exemple est represent* a la figure 17, est charge d'assurer la 

35 lecture ou l'ecriture de bloc en memoire centrale RAM et de 
participer au meintien de la coherence de 1' information dans 
les di verses memoires-ceches MC du systeme mul tiprocesseur . 

A cet effet, il comprend un circu i t 
differenciateur D80 recevant sur_son entree un signal valid et 

40 relie par sa sortie aux entrees S de bascules B80 et B81 ainsi 
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qu'fe I'entrie clr_80 d'un registre a dicalages SR80. Sur la 
sortie o" de la bascule B80, a collecteur ouvert, est dilivri 
le siqnal doT7. La sortie Q de la bascule B81 est reliee a 
5 I'entrie serial_in80 du registre SR80 ? cette bascule B81 est 
relive par son entree T h la sortie 681, inversie, du registre 
5R80. Le registre SR80 recoit sur son entree clk80 le si gnal 
d'horloge ginirale h et son entree de validation en80 est 
toujours active. La bascule B81 et le registre a dicalag e 5R8D 
10 constituent un distributeur de phases DP_M. Le sig nal valid 
est igalement dilivri sur I'entrie de validation en81 d'un 
dicodeur DEC80. Ce dicodeur est relii par son entree de donnie 
a la partie type du bus commun BU5A, et fournlt les siqnaux 
dnp, dl, de, ei et maj. line mimoire vive RAMFG de largeur 2 
15 bits (dinomrais r espec t i vemen t ro et rw) recoit sur son bus 
adresse les champs tag et cadre du bus commun BUSA. Le bus de 
donnie de cette mimoire, constitui des bits ro et rw, est 
relii d'une part a une logique PAL80, d'autre part a une porte 
logique ET80, en direct pour rw, de facon inversee pour ro. La 
20 logique PAL 80 est reliee au champ type et recoit des signaux 
logiques cl, r/w, s/n, mff et en82 : le siqnal cl est issu 
d'une bascule B82, les signaux r/w et s/n d'une file d'attente 
associative AFIF0, le signal mff d'une porte logique ET81, et^ 
le signal en82 d'une bascule B83, qui recoit sur ses entries S 
25 et 7 respectivement des signaux -982 et Q81 inverse's du 
distributeur de phases DP_M. La loqique PAL cable sur ses 
sorties ro-rw les equations logiques suivantes t dnp = 10 ; 
dl.mTf = 10 ; dl.mff = 01 ; de = 01 ; maj.cl = 00 ; 
ei = 01 ; ma j.cl.s/n.r/w = 10 ma j.cl.s/n.r/ w = 01. La sortie 
30 de la porte logique ET80 est relive a I'entrie D d'une bascule 
B84, qui recoit sur son entree horloge la phase 982. La sortie 
Q de cette bascule est reliee a I'une des entries de la porte 
logique ET81, qui recoit sur son autre entrie la sortie de la 
porte logique 0U80. Les deux entries de cette porte logique 
35 0U80 sont relives aux sorties de et dl du dicodeur DEC8Q. 
L'entrie de lecture r de la mimoire RAMFG est reliee a la 
phase 981, et I'entrie d'icriture w a la sortie d'une porte 
logique ET82. La porte logique ET82 recoit sur ses entries le 
siqnal 983 et la sortie d'une porte logique ET83, dont les 
40 entries sont reliies au signal s/n" et a la phase 987, La 
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sortie dnp du decoder DEC80 est reliee a des partes logiques 
ET84 et ET85, qui recoivent sur leur eutre enjree 
respectiven,ent les phases 981 et 985. Le signal s/n es 
5 « q .l...nt delivre vers des portes logiques ET86 et ET87 qui 
recoivent sur leur autre entree respectivement les phases 986 
et 990. La sortie mff de la porta logique ET81 est egalenvent 
reliee a une parte logique ET88, qui regoit sur son autre 
entree la phase 983, et de fagon inversee a des portes 
10 logiques ET89 et ET90 qui recoivent aur leur autre entree 
respectivenent les phases 983 et 987. La sortie de la parte 
logique ET88 est reliee a 1'entree wff de la file AFIFO. Les 
sorties des portes logiques ET8A, ET86, ET89 sent reliees aux 
entrees d'une porte logique 0UB1, dont la sortie est reliee a 
15 I- entree 5 d'une bascule B85. Les sorties des partes loqiques 
ET85 ET87, ET90 sont reliees aux entrees d'une porte logique 
0UB2, dont la aortie est reliee a 1'entree R de la bascule 
R85. Le signal s/n est egalement relie, de fagon inversee, a 
une porte logique ET91 qui regoit sur son autre entree la 
20 phase 989. La sortie de la porte logigue ET91 est reliee a 
1-entree d'une porte logique NOU80 qui regoit sur son autre 
entree la aortie de la porte loqique 0U82. La sortie de ]a 
porte loqique N0U80 est reliee a 1'entree R de la bascule B80. 
La aortie maj du decodeur DEC00 est reliee a 1'entree de 
25 portes logiques ET92, ET93, ET94, ET95, qui recoivent sur leur 
au tre entree respectivement les phases 981, 985, 985, 991. Les 
sorties das portes logiques ET92 et ET93 inversees sont 
reliees respecti vement aux entrees S et R d'une bascule B86, 
et celles des portes logiques ET94 et ET95 aux entrees 5 et R 
30 d'une bascule 882. La sortie 0 de la bascule B82 produit le 
signal logique cl egale-nent delivre a 1'entree eff de la file 
AF1F0 et a 1'entree de commande sel80 d'un multiplexeur MUX 80. 
La partie tag, cadre du bus cnmmun BUSA est reliee a 1'entree 
de donnee de la file AFIF0 et a 1'une des entrees de donnees 
35 du .nultiplexeur M.JX80. La sortie dl du decodeur OEC80 est 
eqale.ent reliee a 1'une des entrees de donnees de 1. file 
AFIFO afin de produire le signal de lecture/ecriture 1/e. La 
sortie de donnee de la file AFIFO est reliee a 1'autre entree 
du multiplexeur HUX80. La aortie du multiplexeur M U X 8 0 est 
40 reliee au bus adresse de la menoire centrale RAM pour la 
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partie teg.cedre, et aux entrees de d£codeurs DEC81 et DEC82 
pour la partie champ cpu. La sortie 0 de la bascule B86 est 
reli6e & l'entree d'ecriture de la mSraoire centrale RAM et h 
5 l'entree £7^84 du decodeur DEC82. La sortie 0 de la bascule 
B85, 16gerement retardee, est relive & l'entree de lecture de 
la m<5moire centrale RAM et & l'une des entrees d'une porte 
logique ET96, qui regoit sur son autre entree la sortie de la 
porte loqique 0U82. La sortie de la porte logique ET96 est 
10 reliee h l'entree en83 du decodeur DEC81. La sortie j du 
ddcodeur DEC81 est reliee a l'entree de validation des buffers 
de passsqe du registre a decalaqe memoire RDM j et la sortie j 
du decodeur DEC82 h l'entree de chargement dudit registre h 

decalage mdmoire RDMj. 
15 Le f onctionnement de cet ensemble est le 

suivant : 

L'activation du signal valid provoque le 
declenchement du distributeur de phases DP_t1, et la validation 
du decodeur DEC80, qui va permettre de determiner la nature de 

20 la requete. La phase 081 est utilisee pour lire l'etet des 
bits correspondent .au bloc demands dans la memoire RAMFG, et 
la combinaison ro.rw est m6moris6e dans la bascule B84. Une 
premiere ecriture a lieu dans la memoire RAMFG sur le phase 
983, qui permet de mettre a jour lea bite d'etats. Leur valeur 

25 est fournie par la logique P ALSO et permet d'obtenir les 
enchainements suivants : 

- en cas de requete de bloc de donnees non 
partagees (dnp) alors quel que soit l'etat des bits ro.rw (rw 
est forcement e z<§ro), l'Stat 10 est force ("bloc diffuse en 

30 lecture") ; 

- en cas de demande de bloc en lecture (dl) 
ou en ecriture (de), si ro.rw s 01, alors la requete est mise 
en file d'attente sur la phase 083 et l'etat 01 est force (en 
fait, c'eat l'etat precedent), sinon l'etat 10 est force en 

35 cas de lecture ("bloc diffuse en lecture") et l'etat 01 est 
forc<S en cas d'ecriture ("bloc diffuse en ecriture") ; 

- en cas de demande de mise h jour (maj), 
l'Stat 00 est forc€ ("bloc non diffuse"). Dans ces divers cas, 
une lecture ou une <§criture en mSmoire centrale RAM est 

40 operee, vers ou e partir du registre a decalage memoire RDMj 
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identifie par le champ cpu du bus commun BUSA. Dans 1'exemple 
choisi, la duree du cycle memoire RAM est de 4 periodes de 
l-horloge generale h. En cas de lecture de donnees non 
5 pertegees, le cycle s'effectue de 981 a 985, dans les autres 
cas de 683 a 987. L'ecriture s'effectue de 981 a 985 •, 

- en cas d'ecriture informative, celle-ci ne 
provoque pas de mouvement de donnees, mais force lea bits 
d'etats a la valeur 01 d'etat de depart est dans ce cas 

10 forctment 10) ; 

- en cas de demande de raise a jour, une 
consultation de la file d'attente AFIF0 est systematiquement 
operee. Cette consultation peut entralner la lecture d'un 
bloc, dans le cas oC une unite centrale CPU est en attente 

15 dans la file AF1F0 de mise a jour de ce bloc. 

La lecture s'effectue de 986 a 990 et l'etat 
des bits est force a 10 (demande pour une lecture) ou 01 
(demande pour une ecriture). La fin de toute operation se 
traduit par la remise a zero de la bascule B80 qui active le 
20 signal doTT. Cette deactivation peut se produire sur les 
phases 985, 987 ou 991 selon l'operation demendee, ou sur 989 
si la consultation de la file donne un resultat negatif. 

La file d'attente associative n'est pas 
detaillee. File est constitute de facon classique d'une 
25 me.oire associative utilisee en file d'attente. Le no-br. de 
mo ts de cette memoire est egal au nombre d'uniU centrale CPU. 
du systeme .nultiprocesseur . Un "daisy-chain'' interne identifie 
sur cheque phase 981 le prochain mot candidat a une ecriture, 
qui se produit le cas echeant sur la phase 983 par le signal 
30 wff. Le signal cff declenche une comparison a partxr de la 
phase 985, les bascules de la memoire de reponse ayant ete 
remises a z6ro sur la phase 984. Le resultat de la comparison 
est repercute sur le signal s/n (some/none) et le contenu du 
.ot concerne est disponible sur la sortie de donnees a partxr 
35 de la phase 986. Ce mot est ensuite invalide sur la phase 990. 

Dana I'architecture ci-dessus decrite, les 
processeurs espions PFj sont sollicites a cheque transfert 
d'adreases aur le bus commun BUSA, avec consultation 
eventuelle de leur memoire-cache H Cj . Cette consultation est 
le plupart du temps inutile (faible probability de cresence de 
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l'sdresse du bloc cor respondant au transfert, dans les 
memoires-caches) . 

II est a noter que le proceaseur de gestion 
5 memoire PGM maintient" des bits d'etat des blocs et rend 
possible une gestion centralist du maintlen de coherence. A 
cet effet, l'on peut rajouter a ^architecture ci-dessus s 
decrite (figure 10) un bus parallele de aynchronisation 
fonctionnant selon le m%me algorithme que le bus de * 
10 synchronisation SYNCHRO de la variants qui est decrite ci- 
apres. Les procesaeurs-espions ne sont plus alors a proprement 
parler des espions ( puisque connectes sur le bus de 
synchronisation et non sur le bus commun BUSA), et sont 
dSsignes par processeurs de raaintien de coherence (PMCj pour 
15 la variante de la figure 18). Ainsi, le processeur de gestion 
memoire PGM demeure sollicitd a cheque transfert sur le hus 
commun BUSA, mais les processeurs de maintien de coherence 
sont sollicites par le processeur PGM uniquement lorsqu'ils 
sont concern6s par le transfert. 
20 La figure 18 pr§ssnte une variante dans 

laquelle la coherence est meintetrue selon le principe ci- 
dessus evoque. Cette variante reprend ^architecture generele 
de la figure 6, evec des adresses de blocs qui transitent par 
les liaisons series LSj. Ce systeme comprend un bus parallfele 
25 de synchronisation SYNCHRO, de meme structure logique que le 
bus commun BUSA, mais pilote b la seule initiative du 
processeur de gestion memoire PGM. 

La structure de l'unite centrale UCj est 
conforme a celle presentee a la figure 10, evec quelques 
30 modifications : 

- la structure de le memoire-cache MCj reste 
la meme, ainsi que la structure du repertoire de gestion RGj , 

- le processeur de qestion parallele PGPj ^ 
disparalt, puisque le bus commun BUSA n'existe plus et les 

35 fonctions qui lui etaient attributes sont reportees sur le 
processeur de gestion de la liaison s6rie PGSj ; 

- ]e processeur espion PEj est remplecS par 
un processeur de maintien de coherence PMCj qui s'occupe du 
maintien des bits d'etats des blocs dans la memoire-cache MCj 

40 en vue d'en assurer la coherence et qui est active a la seule 
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initiative du processeur de gestion memoire PGHj via 1. bus de 

synchronisation SYNCHRO ; 

. le processeur de gestion des requetes PGU 
5 ne connalt plus gu'un seul partenaire : le processeur da 
gestion de la liaison serie PG.Sj, sur lequel 11 reporte 

toutes ses requites ; 

- le processeur de gestion de la liaison 

serie PCS, est charge du transfert des adresses et des 
10 oonnees, confer menent au principe decrit pour le systeme de a 
figure 6, cheque adresse etant prefixee par la nature de la 
requite ? 

- les f onctionnalites du processeur de 
qes tion memoire PGM sent celles decrites en reference a la 

15 figure 17, son activation n'etant plus assuree par le signal 
^Tid, qui disparait (puisqu'auparavant associe au bus commun 
BU5A), mais par Verbitre ABM decrit dans le system de la 
figure 6, lequel serialise les demendes de service qui 
transitent par les liaisons series. La memoire RAMFG est 

20 egalement constitute d'un champ supple mentaire cpu associe aux 

bits d'i*tats ro.rw. 

Le f onctionnement general du mode de 

realisation represents a la figure 18 est le suivant : 

Chaque requete du processeur de traitement 

25 CPU active le processeur de gestion des requetes PGUj avec 
!• indication lecture ou ecriture et code ou donnees. Ce 
processeur requiert un acces au repertoire de gestion RG, 
aupres du processeur de qestion du repertoie PGRj. Le 
consultation du repertoire conduit a 1'un des cas suivents : 

30 le bloc est present dans la memoire-cache 

MC,, avec l'etat non modifie ( m = 0) 5 si la demsnde est une 
lecture, 1 ' inf or ma t i on demandee est extraite de la memoire- 
cache MC, et fournie au processeur de traitement CPUj. Si la 
demands est une ecriture, alors une requete d'ecriture 

35 informative ei est transmise au processeur de gestion de la 

liaison sdrie PCS, ; 

_ le bloc est present dans la memoire-cache 

MCj, avec l'etat modifie (m = 1) ; la demande, lecture ou 

ecriture, est satisfaite ; 

_ i e bloc est absent de la memoire-cache 

40 
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MC- ; une requete de bloc en lecture ou ecriture est transmise 
au processeur de gestion de la liaison sdrie PGSj. 

Ainsi, las requetes faites au processeur de 
5 gestion de la liaison sdrie peuvent etre : une demande de 
lecture de donnas non partagSes (code) s dnp, une demande de 
lecture de bloc : dl, une demande de lecture de bloc en vue 
d f y effectuer une dcriture : de, une demande d»(5criture 

informative : ei. 

10 A ces divers <§tats, il faut ajouter l'Stat 

mise a jour maj correspondent a la purge d'un bloc, soit a la 
demande du processeur de maintien de coherence PMCj, soit pour 
libdrer un emplacement de bloc dans la m<§ m o i r e-cache . Les 
adresses ainsi prSfixSes transitent par les liaisons series 

15 LS-, et conform<§ment au principe <§nonci§ lors de la description 
de l'architecture de la fiqure 6, sollicitent l'arbitre ABM 
lorsque : 

- en cas de lecture bloc, l'adresse est 

transmise, 

20 - en cas d'Scriture bloc, l'adresse et la 

donn£e sont transmises. 

Ces requetes sont traitSes s§quentiellemen t 
par le processeur de qestion m^raoire PGM, de meme structure 
g<§n<Srale que celle ddcrite a la figure 17. Leur traitement est 
25 le suivant : 

1/ dnp : demande de donnees non partagSes. Le 
bloc est transmis et prend l'6tat ro.rw = 10. 

2/ dl : demande de lecture d'un bloc* 

Si le bloc est dans I'dtat "non diffuse^ 1 
30 (ro.rw = 00) ou "diffuse en lecture" (ro.rw = 10), il est 
transmis et prend ou garde l'e*tat ro.rw = 01. 

Si le bloc est dans 1 ' <§ t a t "diffuse* en 
Ecriture", la demande est mise dans la file d'attente AFIF0. 
Le processeur de gestion miSmoire PGM trouve alors dans le 
35 champ cpu de la mSmoire RAMFG l'adresse de la me mo ire-cache 
MC i qui contient la version a jour du bloc demande. Une 
requite de purge est alors imise sur le bus de synchronisation 
SYNCHRO, a seule destination du processeur de maintien de 
coherence PHCj. associe a la mSmoire-cache HC 4 concerned. Cette 
40 demande peut etre Qualified de commande edress<§e. 
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On notera que le processeur de maintien de 
coherence PM^ n'a pas a consulter le repertoire de gestion 
RGj aaaocie puisque le processeur de gestion memoire PGM a 
5 connaissance du fait qu'il est seul posaesseur de la oopie k 
jour. Son r61e conaiste simplement a prelever la requete et a 
la d^poser dans la file FIFOj associee. 

3/ de : demande de lecture d'un bloc en vue 

d'y faire une 6criture. 
1Q si le bloc est dans l'etat -non diffuse" 

(ro.rw = 00), il est transmis et prend l'etat "diffuse en 

ecriture" (ro.rw = 01). 

Si le bloc est dans l'etat "diffuse en 

lecture" (ro.rw = 10), alors le processeur de gestion memoirs 

15 emet une commande universale d' in val i dat ion de bloc, puis 

transmet le bloc avec l'etat "diffuse en ecriture 

(ro.rw = 01). La commande universelle provoque 1-activation de 

tous les processeurs de maintien de coherence PMCj qui 

executent strictement les nremes operations que celles decrites 

20 pour le systfeme de la fiqure 10. 

Si le bloc est dans l'etat "diffuse en 
ecriture'', la demande est miss en file d'attente AFIF0. Comme 
precedemment, le processeur de qestion memoire PGM emet une 
commande adressee au seul possesseur de la copie h jour. 

25 4/ maj : demande d'Scriture d'un bloc par 

suite d'une purge. 

L'algorithme de f onctionnement est dans ce 

cas strictement le meme que celui decrit en reference h la 
figure 17 pour le processeur PGM. 
30 il est h noter que le probleme de 

1-acquittement de l'ecriture trouve naturellement sa solution 
dans ce mode de realisation par une commande adressee 
d ' acquittement. 

5/ ei : Ecriture informative. 

35 ce cas est trait* directement sur le bus 

common BUSA dana 1'architecture presentee a la figure 10. Dans 
le mode de realisation vise ici, et afin de qarantir la 
synchronisation, cette operation est prise en charge par le 
proceaseur de qestion memoire PGM. 

40 Si le bl.oc est dans l'etat "diffuse en 
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lecture", alors une commande, h la fois universelle et 
adressee, est emise : adressee en ce sens que le processeur de 
maintien de coherence PMCj concern^ note l'ecquit temen t de la 
5 demande d'ecriture informative et passe le bloc concern^ dans 
I'^tat " modifie" dans le repertoire de gestion RGj , 
universelle en ce sens que tous les autres processeurs PMC^ 
doivent invalider ce bloc dans leur repertoire. 5 
Le bloc dans l'etat "diffuse en ecriture" 
10 indique qu'une demande d'ecriture informative a 6t6 traitee 
sur ce meme bloc pendant le temps d'attente de traitement de 
la requite. Dans ce cas, la demande d'ecriture informative est 
transform£e en demande d'^criture de, et suit le m%me 
traitement que dans le cas correspondent de l'ecriture. 
15 Le bus parallfcle de synchronisation SYNCHRO 

est charge de diffuser des adresses de bloc prefixees par un 
numero de processeur et un type de demande, soit environ 30 
h 40 bits selon les caracteristiques du mul tiprocesseur. Ces 
informations sont de plus trans mises de fagon 
20 unidirectionnelie. Leur transfert peut alors avantageusement 
la encore se faire par une liaison serie. La cadence de 
transfert est moins critique que pour les blocs, et des 
solutions simplifiees peuvent Stre envisagees, par exemple par 
le biais de circuits "TAXI" fabriques par la Societe "A.M.D." . 
25 La figure 19 presents un schema synoptique 

partiel d'une architecture conforme h I'invention, dans 
laquelle plusieurs unites centrales UC k ... sont reunies en 
grappe ("cluster") et partagent une meme liaison serie LS k . 
Dans ce but, un arbitre local ABL k essocie a la qrappe est 
30 charge d'arbitrer les conf lits d'acces aux moyens de 
communication d'adresses de blocs, et partage avec le 
processeur memoire PGM, amenage h cet effet, un signal busy k 
indiquant en permanence l'etat libre ou occupe de la liaison * 
serie L5 k » Des moyens de codage et de decodage d'un en-tete 
35 d"identif icat ion du processeur concern^ h l'interieur d'une * 
qrappe sont associes aux logiques d f emission et de reception 
des blocs de donnees. 

Dans le cas ou les moyens de communication 
d'adresses de blocs sont constitues par le bus commun BUSA, le 
40 f onctionnement est le suivant : 
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Si l'unite* centrale CPU k+ j desire faire un 
transfert de bloc dans le sens mdmoire centrale RAM vers 
memoire-cache MC k + j (cas dnp, dl, de) ou effectuer une 
5 ecriture informative ei, alors elle requiert l'ecces vers le 
bus commun BUS A a l'arbitre local ABL k , qui repercute la 
demande, son tour venu, a l'arbitre AB. L'accord d'acces eu 
bus commun BUSA est renvoyg sur Ignite* centrale CPU k+ j et le 
transfert s'effectue de la facon decrite en reference a la 

10 figure 10. Tout bloc transmis dans le sens memoire centrale 
RAM vers me*moire-cache MC k+ j doit alors etre identified car 
I'ordre des demandes n'est pas respecte du fait de la 
possibility de mise en attente dans la file AFIFO du 
processeur de gestion mSmoire PGM. Si l'unit<§ centrale CPU k + J . 

15 desire faire un transfert de bloc dans le sens memoire-cache 
MC k+j vers la memoire centrale RAM (cas maj), alors elle 
requiert tout d'abord de l'arbitre local ABL k l'acces a la 
liaison s^rie LS k . L'arbitre local ABL k et le processeur de 
gestion memoire PGM sont susceptibles tous deux de s ! attribuer 

20 la liaison se~rie LS k s la contention est (§ v i t S e en 
synchronisant la modifiction du signal busy k avec le signal 
valid (le processeur de gestion m<5moire PGM ne peut lancer ou 
relancer un transfert qu'eu cours d'une transaction memoire). 
L'accord d'occupation de la liaison s<§rie LS k conduit l'unite 

25 centrale CPU k + J - a transferer son bloc d 1 i n f o rm a t i on vers le 
registre a de§calage memoire RDM k> puis a requ^rir de l'arbitre 
local ABL k l'acces au bus commun BUSA afin d'y effectuer la 
demande de mise a jour, qui s'effectue selon l'slgorithme 
decrit en reference a la figure 10. L'Scriture de mise a jour 

30 peut entrainer une liberation de bloc dans la file d'attente 
AFIFO du processeur de gestion mdrnoire PGM et requerir un 
registre a d^calages RDM j occupe. Dans ce cas, le transfert 
demand^ est retard^ et chaine* au transfert en cours. 

Dans le cas ou les moyens de communication 

35 d'adresses de blocs sont les liaisons series elles-roemes, le 
fonct ionnement est alors identique au cas precedent pour ce 
qui est de la preemption de la liaison serie, et identique 
pour l'alqorithme general de fonct ionnem ent a celui presente 
en reference a la fiqure 17. 

40 Par exemple, une demande de lecture de bloc 
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issue de l'unite centrale CPU k+ j ndcessite tout d'abord un 
accord d'acc&s h la liaison serie LS^, accord donnt par 
l ! arbitre local ABL^ en concertation av-ec le processeur de 
5 gestion memoire PGM. L'accord d'acces entraine le transfert de 
l'adresse du bloc demande* sur la liaison strie LS^, qui est 
"aussit&t libtrte : elle est disponible pour toute autre 
transaction si necessaire. Une demande d'ecriture de bloc suit 
le mSme protocole pour l'acces h la liaison strie LS^. 
10 Dans les- architectures decrites en rtftrence 

a u x figures 1 a 19, i 1 existait autant de registres a 
dexalages mtmoires RDMj que d'unitts centrales CPUj : une 
liaison serie LSj etait affectee de fagon statique h un couple 
(RDMj, CPUj). 

15 5'il doit b l'evidence exister au moins une 

liaison strie LS- entre une unite" centrale et la memoire 
centrale RAM, le nombre de registres a decalages RDMj peut 
etre inf^rieur. En effet, si tacc est le temps d'acces a la 
memoire centrale RAM et ttfr le temps de transfert d'un bloc, 

20 il n'est pas possible de maintenir plus de n s ttfr/tacc 
registres a decalages simultane ment occupes. Par exemple, pour 
tacc = 100 ns et ttfr = 1 200 ns, on obtient n = 12. 

Tacc et ttfr sont alors des cri teres 
caracttristiques de la performance du systeme mul t iprocesseur 

25 conforme a l'invention et la mise en placede n reaistres a 
ddcalages mtmoires RDMj est compatible avec un nombre 
superieur de liaisons series LS- q u 1 a la condition 
d'intercaler une loqique de type reseau d 'interconnexion RI 
entre registres et liaisons, I'af f ectation d'un registre 

30 memoire RDMj h une liaison strie LSj.etant rdalisee de fagon 
dynamique par le processeur de qestion memoire PGM. 

Par ailleurs, la memoire centrale RAM sera 
gdntralement constitute . par m bancs mdmoires RAM^, ... RAM p1 
RAM m agences en paralleles, chaque banc memoire comportant n 

35 reqistres a decalages RDMj relies par un rtseau 
d'in terconnexion RI p a I'ensemble des liaisons series LSj. II 
est alors possible, sous reserve que les adresses de blocs 
soient uniformSment distribute sur les bancs memoires RAM p , 
d'obtenir une performance thtorique de m x n registres a 

40 decalages simul tenement actifs. La distribution uniforme des 
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adresses est assur<§e par des mScanismes classiques 
d 1 entrelag ages des adresses* 

Sur la figure 20a, on a represents 
5 partiellement une architecture conforme a l'invention, 
comportant m bancs m^moires RAM p avec n registres a de*calages 
RDMj par bancs m^moires et q unites centrales UCj. Cheque banc 
mgmoire est de type a acces aieatoire dote d'une entree/sortie 
de donn^es de larqeur correspondent a un bloc d'inf orma tians 

10 bi, cette entree/sortie etant (comme pr^c^demment pour la 
mdmoire RAM) relive par un bus perallele h l'ensemble des 
registres eiementaires RDM ip ... RDMj p . 

Le reseau d 1 int erconnexion est de structure 
connue en soi ("cross-bar", "delta", "banyan"...). On notera 

15 qu'un reseau multi-Stage est bien adapts dans la mesure oO le 
temps d^tablissement du chemin est n^gliqeable devant son 
temps d'occupation (le temps de transfert d'un bloc) et qu'il 
ne concerne qu'un bit par liaison. 

Le processeur de gestion m^moire PGM est 

20 adapte* pour pouvoir assurer l'allocation dynamique d'une 
sortie a une entree du reseau, c'est-a-dire mettre en relation 
un reqistre a decalage memoire RDMj et une liaison s£rie LS^ 

Dans le cas oti les moyens de co m m m un i c a t i on 
d'adresses de blocs sont constitutes par le bus commun RUSA, 

25 le fonctionnement est le suivant : 

En cas de demande de lecture d'un bloc de la 
part de l'unite centrale CPUj, le processeur de qestion 
memoire PGM p concerne* alloue un registre a decalage RDM.., 
commande le reseau d'interconnexion RI en consequence et 

30 initialise le transfert. 

En cas de demande d'£criture d'un bloc de la 
part de l'unite centrale CPUj, un chemin doit au prdalable 
etre etabli. A cet effet, une premiere requete d'etablissement 
de chemin est <§mise sur le bus commun BUSA, suivie de la 

35 demande d'ecriture effective des transfert du bloc de la 
memoire-cache M C j au registre a decalage RDM... Lors de la 
premiere demande, le processeur de gestion memoire PGM est 
charge d'allouer un chemin et de commander le reseau 
d'interconnexion RI. 

40 Dans le cas oCi les moyens rie communication 
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d'adresses de blocs sont lea liaisons series elles-memes, un 
chemin doit etre etabli h tout pr^alable de transfert. Ce 
problems est identique au probleme classique du partage d'un 
5 ensemble de n reseources par m utilisateurs et peut etre r«5gle" 
par des solutions classiques d'arbitrages de conflits d'acces 
(protocoles de communication, signaux supplSmentaires) « 

Dans l'exemple d'archit ecture represents a la 
figure 5, les reqistres a de"calages RDMj et RDPj, leurs ^ 
10 logiques de validation LV1 et LV2 etaient r£alis£es dans une 
technoloqie rapide, l'ensemble £tant synchronise par une 
horloge de frequence F au moins Sqale a 100 MHz. 

La figure 20b prSsente en variant e h 
l ! architecture proposed a la figure 20a, une solution conforme 
15 h l'invention dans laquelle cheque liaison sdrie LSj, qui 
relie le processeur CPUj & tous les bancs mSmaires, est eclat£e 
en m liaisons series LSj p reliant en point en point le 
processeur CPUj a chacun des bancs memoires R AM p . 

Ce p r o c £ d 6 presente le double avantaqe 

20 suiyant : 

- chaque liaison 6tant du type point a point, 
peut raieux etre adaptee du point de vue Slectriaue ou du point 
de vue fibre optique, 

- un niveau de paralle lism e sup pl£ men ta i r e 
25 est obtenu des lors que le processeur de traitement est en 

mesure d f anticiper desdemandes de blocs, ce qui est le cas 
actuellement pour les processeurs les plus performants. 

La loqique d'interface (not£e pr£c§demment 
TFR j et RDPj) Qui est associee b la liaison serie LSj, cotd 

30 processseur CPUj, est alors dupliquee en m exemplaires I^... 
Ip»». I m . On notera la presence d'une liaison de maintien de 
coherence de l 1 information, prive*e a chaque banc mSmoire RAM p . * 
Le f onctionnement de cette liaison est analogue a celui du bus 
SYNCHRO de la fiqure 18. ? 

35 On a represents aux figures 21a et 21b une 

autre structure de m£moire RAM qui comprend 2 U plans memoires, 
chaque plan memoire prSsentant un front de t/2 u informations 
binaires (pour des raisons de clarte, I'on a represents & la 
figure 21a les moyens nScessaires a la lecture d'un bloc bi, 

AO et & la figure 21b les moyens nScessaires h 1'Scriture). Les 
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registres a d^calages RDM j ou RDPj sont constituSs de 2 U sous- 
registres a decalages 616m entaires RDMj p a t/2 u bits de 
capacity. L'exemple presente k la figure 20 est une 
5 realisation a 8 plans memoires (u = 3). (Pour la clarte du 
dessin, il a 6t6 represente un seul registre a dScalage RDMj 
forme pour l'ensemble des sous-regis tres RDM j p )* Cheque plan 
memoire RAM comporte en regard de son front d'accfes un 
ensemble de registres a decalages ^limentaires RDM j p et est 
10 capable de fonctionner avec une frequence de ddcalage d'au 
moins F/2 U . 

Le f onct ionnement de l'ensemble en cas de 
lecture est illustre* a la figure 21a. Un bloc est lu de facon 
synchrone dans l'ensemble des 2 U plans m^moires et charge de 

15 meme dans les registres eU<§ men taires de meme rang. Les sorties 
series de ces registres sont connecte§es aux entrees d'un 
multiplexeur MUXR realist en technologie rapide ( A 5GA } . Un 
circuit de ce type, parf ait ement adapts, est disponible chez 
"GIGABIT LOGIC", sous la reference "10G040", et est capable de 

20 deiivrer un signal loqique a une frequence de 2,7 GHz. 13 
fournit par ailleurs une horloge de frequence divis^e par 
huit, qui constitue l'horloge de decalage des registres 

eiementaires RDM j p . 

En cas d'ecriture, un f o n c t i o n n e m e n t 
25 symdtrique, presente a la fiqure 21b, est obtenu avec un 

circuit de multiplexeur DMUXR du meme fabricant (reference* 

"lOGAl"), avec les memes caracteristiques de performances. 

Dn obtient ainsi une frequence de transfert 

de 500 MHz avec 8 registres eiementaires fonctionnant a une 
30 frequence de 500/8 r 62,5 MHz, ce qui les rend rSalisables 

dans une technologie plus conven tionne 1 le ("M0S" par exemple). 

Les circuits multiplexeurs et demultiplexeurs 

r^f^renc6s ci-dessus sent combinables en ensembles de 16, 

32, ... bi ts. Ainsi, en associant respe c t i v e m en t 16, 32 plans 
35 memoires fonctionnant a 62,5 MHz, il est possible d'obtenir 

des debits de 1 et 2 GHz, soit un niveau de performances 2 a 4 

fois supdrieur. 

II eat a noter que la logique TFR peut etre 
realisee sur l'un des reqistres 6 le m e n t a i re s , et que la 
40 logique de validation LV est integrSe aux circuits "A SGA" 
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(sortie a collecteur ouvert). 

La figure 22 pr£sente la structure gSnerale 
d 1 u n composant de type circuit int^grd "VLSI 11 , d 6 n o m m e* 
5 "mdmoire multiport s£rie" et susceptible d'Squiper un systeme 
multiprocesseur conf orme a l'invention. Ce composant peut etre 
utilise dans l'architecture multi-processeurs d£crite 
prScgdemment, soit pour rSaliser la mdmoire centrale RAM et 
les reqistres a d^calage RDMj associSs, soit pour realiser 
10 cheque m£moire-cache MCj et son registre a decalage Pour 
simplifier les notations, on a qarde* dans la description qui 
suit les syrnboles relatifs a la m^raoire centrale RAM et les 
registres a decalage associe"s. 

La liste des broches de ce circuit avec les 
15 signaux correspondents est la suivante : 

- adbioc0-adbloc m _i ; m bits d'adresses de 

bloc bi, 

- admotQ-admot k _2 : k bits d'adresses de mots 

dans le bloc, 

20 - nurareg 0 -numreg n _ 1 1 n bits d'adresses de 

registres rd, 

- cs : "chip select" : siqnal de selection du . 

circuit, 

- vTr : "write" : signal d'6criture, 
25 - Td" : "read" : signal de lecture, 

- bit/bloc : signal de commande de la 
fonction multiport, 

- normal/config ; siqnal de mode de . 

f onctionnement , 
30 - data n -data 1-:L s 1 bits de donn§es, 

- h^-h n : n signaux d'horloge, * 
" d l""^n 5 n s *9 nau * de donn^es. 

Les valeurs m, n, 1 sont fonctions de l'6tat i 
courant de technologie. Des valeurs actuelles pourraient etre 
35 les suivantes : 

- m = 16 soit 2 16 blocs bi de 64 bits chacun 

(soit 4 Mbits), 

- n s 3 soit 8 registres rd, 

-1=8 soit un interface parallele de type . 

40 octets, 
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« k = 3 du fait de la presence de 8 octets 

par bloc. 

Le composant vise comporte une cinquantaine 

5 de broches. 

Ce circuit m<§moire nultiport_ eirie est 
compose d'une memoire vive a acces aieatoire RAM, de largeur 
predeterminee t, susceptible d'etre commandSe en ecriture sur 
des fronts independents de largeur t/4 (valeur choisie a titre 

10 d'exemple sur la figure 22) et t/1. Les lignes de donn^es de 
cette memoire RAM sont relives aux entries d'une logique de 
type "barillet" B5 ("Barrel shifter"), ou de roultiplexage MT, 
selon la version de composant, la logique de multiplexaqe MI 
pouvant etre conside><§e comme offrant un sous-ensemble des 

15 possibility de la logique "barillet" et done plus simple b 
r^aliser. Les signaux d'adresses et de commande de cette 
memoire RAM, a savoir csi, wri, rdi, adbloci, sont ddlivrSs a 
partir d'une logique de commande COM • Cette logique COM recoit 
en outre les signaux d'inf orma ti ons des broches c¥, wr, F3 , 

20 bit/bloc, normal/conf ig, numreq et est relive, d'une part, par 
des lignes de commande "format" a*la loqique de type 
"barillet" BS, d'autre part, a la sortie d'un reqistre de 
configuration RC1, et e l'entree d'une logique de selection 
LSR fournissant des signaux srrig,... srd p _ 1 et src 1 , src 2 , 

25 src 3 . Les sorties rie la loqique de type barillet BS 
constituent un bus interne de communication parallele BUSI, 
relie a un ensemble de registres a ddcalages RD Q , ... RD n-1 , 
d'une part, sur leurs entrees paralleles et, d'autre part, sur 
leurs sorties parallfcles a travers des buffers de validation 

30 BVlOOg,... BV100 n _ 1 et & l'entrde parallele des registres de 
configuration RC^, RC2*«» RC^. 

Les 1 bits de faible poids du bus BUS! sont 
egalement recus sur les 1 broches datag... dataj^. Chaa . ue 
reqistre a decalaqe RD ^ et des portes logiques associees 

35 constituent une unite f onctionn.elle ELRDj , pilotee par un 
ensemble d^Uments logiques qui constituent une logiaue de 
forcage LF^ Chaque unite f onctionnelle ELRDj comporte des 
portes logiques ET100.. et ET101 ir relives sur l'une de leur 
entree a la sortie ardi de la logique de selection LSR, et 

40 recevant sur leur autre entree respec tivement les signaux rd i 
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et wr^ La sortie de la porte logique ETIOO^ est relive a 
l'entrde loadlOO^ du registre a d£calage RD^, ainsi qu'a 
1'entree loadlOlj et a l'entr^e 5 respecti vement d'un compteur 
5 CPTIOO^ et d'une bascule B100 i appartenant a la logique de 
forgaqe LF^» La sortie de la porte logique ETIOI^ est relide a 
1'entree de commande des buffers de validation BV100^« La ? 
sortie di est connected a la sortie d'une porte logique PL^, 

a 

qui regoit sur son entree de donnSe la sortie s 6 r i e du 

10 registre a d^calage RD^ et sur son entree de commande la 
sortie d'une porte logique OUIOO^. Le signal issu de la broche 
h ± est de*livre* a I'entrile clkl00 i du registre RD . ainsi qu'a 
l'entre*e downlOO^ du compteur CPTIOQ^ La sortie zerolOG^ du 
compteur CPTIOO^ est relive a I'entr^e R de la bascule BIOO^. 

15 La logique de forgaqe LF^ comporte en outre 

un multiplexeur MUXlOOj qui regoit sur ses entrees de donnees 
les valeurs t et t/4. La sortie de donnde du multiplexeur 
MUXIOO-^ est relieve a 1'entrSe de donnee du compteur CPT100 i , 
et la commande de selection sellOO^ du multiplexeur MUX100 i 

20 est relive a la sortie 1 du registre RC^. La sortie Q de la 
bascule B100. est relive a I'une des entries d'une porte 
logique ET102£, qui regoit sur son autre entree le signal issu 
rie la broche i d'un reqistre RC 2 - La sortie de la porte 
logique ETIOZ^ est relive a l'une des entrees de la porte 

25 logique 0U100^ t qui recoit sur son autre entree le signal issu 
de la broche i d'un registre RC^. Les entries de chargement 
des registres RC lf RC 2 , RC3 regoivent respect ivement les 
signaux src^, src2* srcj issus de la logique de selection LSR. 

Ce comppsant prgsente une dualite" de 

30 fonctionnement t si le signal bit/bloc est dans I'Stat "bit", 
alors le fonctionnement de ce composant est celui d'une ? 
mimoire a semi-conducteur con ventionnelle ; les signaux adbloc 
associ£s aux signaux admot constituent le bus d'adresse en r 
unite" mot (8 bits dans l'exemple), les signaux c"s, 7d , wr ont 

35 le sens habituel attribue" b ces siqnaux, et les broches data 
v^hiculent les donnees. 

De fagon interne, en lecture le bloc 
d'information desiqne* par adbloc est lu en mdmoie RAH et 
presents a l'entr£e de la logique de barillet B5 ou de 

40 multiplexaqe MT. La combinaison des signaux admot et bit/bloc 
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permettent a la logique de commande COM de fournir a la 
loqique de barillet BS ou de multiplexage MT les signaux 
"format"* Le mot concerne* est alora cadre* a droite en sortie 
5 de la logique de barillet ou de multiplexage et presente ainsi 
sur les broches de donnde data. 

De facon interne, en Scriture le mot presente' 
sur les lignes de donnee data est cadre" par la logique de 
barillet L5 ou de mult iplexaqe MT par les memes signaux de 

10 commande format qu'en lecture, en regard de sa position dans 
le bloc. La logique de commande COM e*met alors un signal 
d'6criture wri partiel sur le seul "troncon" de m<§moire 
concerned et a 1'adresse dt§siqnt§e par les signaux adbloc. 

Si le signal bit/bloc est dans l'£tat "bloc", 

15 alors le f onctionnement ridpend de l'etat du signal 
normal/conf ig. Le mode confiq programme les registres de 
configuration RCj, RC 2 , RC 3 adress^s par les signaux numreg, 
et programmes a partir des lignes de donnSes date* Le registre 
RCjl permet de modifier la taille du bloc : t et t/4 dans 

20 l'exemple, soit 64 bits et 16 bits. De facon interne, le 
f onctionnement est similaire a celui ddcrit dans le mode de 
f onctionnement "bit" : t ou t/4 bits sont cadres sur le bus 
interne BUSI (en lecture), ou en regard du "troncon" de bloc 
concern^ (en gcriture). Des tailles de blocs multiples peuvent 

25 etre envisagees (t, t/2, t/4...). 

Le registre RC3 permet de choisir pour cheque 
registre un sens permanent de f onctionnement : soit en entree 
(RC3 i = 0) soit en sortie (RC3 i = 1). Ce sens permanent permet 
d'adapter le composant aux liaisons series a liens 

30 unidirectionnels permanents. Le reqistre RC 2 permet de choisir 
pour chaque reqistre, sous reserve que le bit correspondent de 
RC3 soit a l'£tat logique 0, un mode de f onct i onnem ent a liens 
bidirectionnels alternSs : sur une lecture m£ moire RAM, le 
registre a decelage RD i concerne "passe" en mode sortie pour 

35 le temps de la transmission du bloc, puis revient a l'etat de 
repos en mode "entree". De facon interne, la bascule BlOO^ 
qui pilote la porte loqique PLp est mise a 1 sur un siqnal de 
chargement du registre R D M ^ et remise a z6ro a l'issue du 
transfert des t ou t/4 bits, par l'intermediaire du compteur 

40 CPT100., initialise* a t ou t/4 selon l'Stat du registre RC-p 
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et qui recoit stjr son entrde de ddcomptage les impulsions 
d'harloqe hi. En f onctionnement normal (signal normal/ conf ig 
dans l r 6tat normal) pour une lecture, le bloc adresse* par les 
5 broches adbloc eot charge* dans le registre RD^ adressd par les 
broches numreg. Si le bloc est partiel (t/4), alors il est 
transrais en position faible poids sur le bus interne BUS! par % 
la logique de type barillet BS ou de multiplexage MT. Ce bloc 
est alors transmis des activation du signal d'horloge hi* % 

10 En f one tionnement normal pour une e*criture, 

le contenu du registre RD^ adresse* par les broches numreg est 
ecrit dans le bloc mSmoire RAM d'adresse adbloc. Si le bloc 
est partiel, il est transmis en position fort poids sur le bus 
interne BUSI, puis cadre* en "regard" du troncon de bloc 

15 concerne" par la logique de type barillet BS ou de multiplexage 
MT, et enfin un signal partiel d'Scriture wri est emis sur le 
troncon concerned 

II est a noter que si un bloc partiel est en 
service, alors l'adresse de ce bloc partiel dans le bloc est 

20 fournie par les lignes d'adresse admot. 

Ce composant est parfaitement adapts aux 
diverses variantes d 1 architectures d^crites. Associes en 
parallele, 8, 16... circuits de ce type permettent de re*aliser 
le dispositif riScrit aux figures 20a, 20b. Si la mgmoire RAH 

25 est en technologie rapide, alors ce composant peut egalement 
etre utilise au niveau de la mi moire-cache, en multiplex.ant , 
selon le dispositif demerit aux figures 20a, 20b, les reqistres 
internes d 1 un mSme composant. 
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REVINDICATIONS 
1/ - Systeme multiprocesseur, du type 
comprenant une memoire centrale (RAH) organisee en blocs 
S d'informations (bi), des procesaeurs de treitement (CPU^.. 
CPU.... CPU ), une m e m o i r e - c a c h e (MCj) relive a cheque 
processes "de traitement (CPUj) et organises en blocs 
d'informations (bi) de meme taille que ceux de la memoire 
centrale, un repertoire (RGj) et son processeur de gestion 
10 (PC) associe a cheque me mo ire-cache (MCj), des moyens de 
communication d'adresses de blocs entre procesaeurs (CPUj) et 
memoire centrale (RAH), ledit systeme multiprocesseur etant 
caracterise en ce qu'il est dote : 

. d'un ensemble de registres h decalage, dit 
15 registres-memoire <R0M I ... RDM j... RDM n ), cheque registre 
(RDMj) de cet ensemble etant connecte a la memoire centrale 
(RAM) de facon a permettre, en un cycle de cette memoire, un 
transfert parallele en lecture ou ecriture d'un bloc 
d'informations (bi) entre ledit registre et ladite memoire 
20 centrale, 

. des registres & decalage, dits registres- 
processeur (RDP X ... RDPj... RDP p ), cheque reqistre a decalage 
processeur (RDPj) Stent relie a la memoire-cache (MCj) d'un 
processeur (CPU j) de facon a permettre un transfert parallele 
25 en lecture ou ecriture d'un bloc d'informations (bi) entre 
ledit reqistre h decalaqe (RDPj) et ladite memoire- 
cache (MCj), 

ensemble de liaisons series (LSj. 



un 



LSj... LS n ), chacune reliant un registre a decalage memoire 
30 (RDM.) et un registre & decalage processeur (RDPj) et adapte 
pour permettre le transfert de blocs d'informations (bi) entre 
les deux registres considers (RDMj, RDPj). 

2/ - Systeme multiprocesseur selon le 
revendication 1, caracterise en ce que : 
35 - cheque registre & decalage memoire (RDMj) 

et cheque registre a decalage procesaeur (RDPj) sont dedoubles 
en deux registres, l'un specialise pour le transfert dans un 
sens, l 1 autre pour le transfert dans 1 'autre sens, 

- chaque liaison serie (LSj) comprend deux 
40 liens sdries unidirectionnels de transfert bit a bit, reliant 
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le registre a decalage mgmoire (RDM j) d6doubl£ et le registre 
a d^calege processeur correspondant (RDPj) dSdouble", ces liens 
e*tant connects auxdits registres pour permettre, l'un un 
5 transfert dans un sens, l'autre un transfert dans l'autre 
sens . 

3/ - Systfeme multiprocesseur selon la ? 
revendication 1, caract£ris6 en ce que chaque liaison 
serie (LSj) comprend un lien bidirectionnel de transfert bit a * 

10 bit, connects au registre a decalage mSmoire (RDM j) et au 
registre a dScalage processeur correspondant (RDP.) et une 
logique (LV) de validation du sens de transfert de fagon h 
permettre un transfert alterne* dans les deux sens. 

4/ - Systeme multiprocesseur selon l'une des 

15 revendications 1, 2 ou 3, caractSrise' en ce que les moyens de 
communication d'adresses comprennent un bus commun de 
communication parallele d'adresses de blocs (BU5A) reliant les 
processeurs (CPUj) et la mSraoire centrals (RAH) et un arbitre 
de bus (AB) adapts pour g6rer les conflits d'acces audit bus. 

20 5/ - Systeme multiprocesseur selon l'une des 

revendications 1, 2 ou 3, caracte" risd en ce que les moyens de 
communication d'adresses comprennent un registre a de"calage 
complSmentaire (RDCj) connects sur chaque liaison s6rie (L5j) 
en parallele avec le registre a d£calage mSmoire correspondant 

25 (RDMj) de facon a permettre la transmission des adresses par 
les liaisons series et leur chargement dans lesdits reqistres 
a dScalage compl^ mentaires (RDCj), un arbitre de qestion 
d'acces (ABM) Stent reli<§ auxdits registres a decalaqe 
complementaires (RDCj) et a la memoire centrale (RAM) en vue 

30 de pre*lever les adresses contenues dans lesdits registres 
(RDCj) et de qerer les conflits d'acces a la m£moire centrale 
(RAM). * 

6/ - Systeme multiprocesseur selon l'une des 
revendications 1, 2, 3, 4 ou 5, comprenant des moyens de * 

35 qestion des donne"es partagSes entre processeurs, en vue d'en 
assurer la coherence- 

7/ - Systeme multiprocesseur selon la 
revendication 6, caract£ris£ en ce que les moyens de qestion 
des donnSes partag^es comprennent : 
40 . un bus special de communication parallele 
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de mots (BUSD) reliant les processeurs (CPUj) et la m<§moire 
centrale (RAM), 

. une logique de partition (LPj), associ<§e a 
5 chaque processeur (CPUj) et adaptee pour differencier les 
adresses des donnees partaqees et celles des donnees non 
partagees de facon fe transmettre cellee-ci sur les moyens de 
communication d'adresses avec leur identification, 

. une logique de d^codage (DEC) associee a la 
10 memoire centrale (RAM) et adaptee pour recevoir les adresses 
avec leur identification et aiguiller les donnees en sortie 
memoire soit vers le registre a decalage memoire correspondent 
(RDMj) pour les donnees non partagees, soit vers le bus 
special de communication de mots (BUSD) pour les donnees 
15 partagees. 

8/ - Systfeme multiprocesseur selon la 
revendication 6, carect<§rise en ee que les moyens de gestion 
des donnees partaqees comprennent, d'une part, un bus special 
de communication parallele de mots (BUSD) et un bus special 

20 commun de communication d'adresaes de mots (BUSAM) reliant les 
processeurs (CPUj) et la memoire centrale (RAM), d'autre port, 
une logique de partition (LPj), associee fe chaque processeur 
(CPU.) et adaptee pour differencier les adresses des donnees 
partagees et celles des donndes non partagees, de fagon & 

25 aiouiller les premiferes vers le bus special commun (BUSAM) et 
les secondes vers les moyens de communication d'adresses de 
bloc . 

9/ - Systfeme multiprocesseur selon les 
revendications 4 et 6 prises ensemble, caract(§rise en ce que 

30 les moyens de qestion des donnees partagees comprennent un 
processeur de gestion memoire (PGM) associe h la memoire 
centrale (RAM) et un processeur espion de bus (PEj) associe h 
chaque processeur de traitement (CPUj) et au repertoire rie 
qestion correspondent ( RG j) , cheque processeur espion de bus 

35 (PE,) et le processeur de gestion memoire (PGM) etant 
connectes au bus de communication d'adresaes (BUSA) en vue 
respectivement de surveiller et de traiter les adresses de 
blocs transmises sur ledit bus de facon a permettre une mise a 
jour de la memoire centrale (RAM) et de la me m o i r e-c a ch e 

AO associee (MC f ) en cas de detection d'une adresse de bloc 



SS0022002273 



WO 89/06013 



PCT/FR88/00608 



84 

presente dans le repertoire associe* (RGj). 

10/ - Systeme m u 1 t i p r o c e s s eur selon les 
revendica t i ons 4 et 6 prises ensemble, ceracterise en ce que 
5 les moyens de qestion des donnges parts gees comprennent un 
processeur de gestion memoire (PGM) associe a la memoire 
centrale (RAM) et un processeur de. maintien de la coherence - 
des donnees partaqees (PMCj) associS a chaque processeur de 
traitement (CPUj) et au repertoire de gestion correspondent * 
10 (RG-), chaque processeur de maintien de coherence (PMC.) £tent 
connects a un bus de synchronisation (SYNCHRO) pilote* par le 
processeur de gestion mdmoire (PGM), de facon a permettre une 
mise a jour de la memoire centrale (RAM) et de la memoire- 
cache associee ( HC j) en cas de detection d'une adresse de 
15 bloc, une mise a jour de la memoire centrale (RAM) et des 
me"moires-caches (MCj) * chaque pr^levement d'adresses sur le 
bus commun d'adresses BUSA, 

11/ - Systeme multiprocesseur selon les 
revendicat ions 5 et 6 prises ensemble, caracterisS en ce que 
20 les moyens de qestion des donnees partaqees comprennent un 
processeur de gestion memoire (PGM) associe a la memoire 
centrale (RAM) et un processeur de maintien de la coherence 
des donnees partaqees (PMCj) associ6 a chaque processeur de 
traitement (CPU.) et au repertoire de qestion correspondent 
25 (RG j) t chaque processeur de maintien de coherence (PMCj) £tant 
connects a un bus de synchronisation (SYNCHRO) pilots par le 
processeur de gestion memoire (PGM), de facon a permettre une 
mise h jour de la mdmoire centrale (RAM) et de la memoire- 
cache associee (MCj) en cas de detection d'une adresse de 
30 bloc, une mise a jour de la memoire centrale (RAM) et des 
me'moires-caches ^ MC j^ 6 chaque pre*levement d'adresses dans les ^ 
registres a de*calage compl£mentaires (RDCj). 

12/ - Systeme multiprocesseur selon l'une ^ 
des revendications 1 a 11, caractgrise" en ce que : 
35 - plusieurs reqistres a dSealaqe processeur 

(RDP^, RDP k+1 *.«) correspondant a un ensemble de processeurs 
determine* (CPU k , CPU k+1 ~.) sont connected en paralleles a une 
meme liaison serie (LS k ), un arbitre local ( A B L k ) etant 
associe a chaque ensemble de processeurs (CPU^, CPU^^^^^ en 
40 vue d'arbitrer les conflits d'acces a la liaison serie (LS k ), 
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un processeur de qestion memoire (PGM) est 



reli<§ aux moyens de communication d'adresses de blocs et a la 
memoire centrale (RAM) et comprend des moyens de codage 
5 adaptes pour associer a chaque bloc d'informations (bi) un en- 
tete d'identif ication du processeur concern^ parmi chaque 
ensemble (CPU k , CPU k+1 ...) partaqeant une liaison aerie 
donnte (LS k ) , 

- les processeurs de qestion (PG k , PG |< + 1'**^ 
10 associes aux memoiree-caches (MC k , MC k+1 ...) des processeurs 

de 1'ensemble precite (CPU k , CPU k+ ,...) comprennent des moyens 
de d<§codeqe de l'en-tite d' identification. 

13/ - Systfeme multiprocesseur selon l'une des 
revendioations 1 a 12, caracterise en ce que chaque registre a 
15 decalaqe memoire (ROMj) eat connecte de fagon statique a une 
liaison serie (LSj) specif iquement affectee audit reqistre. 

14/ - Systeme multiprocesseur selon l'une 
des revendioations 1 fe 12, caracterise en ce que : 

- un processeur de gestion memoire (PGM) est 
20 associe a la memoire centrale (RAM) et comprend une logique 

(ALLOC) d'af fectation des registres fe dtlcalage memoire aux 
liaisons series, 

- les reqistres & decalaqe memoire (RDHj... 
RDM i... RDM n ) sont connectes de fa?on dynamique aux liaisons 

25 series (LSj... LSj...) par l'entremise d'un reseau 
d'interconnexion (RI) commande par le processeur de qestion 
memoire (PGM). 

15/ - Systfeme multiprocesseur selon l'une des 
reven.H.cations 1 a 14, dans lequel le memoire centrale (RAM) 

30 est constitute par m bancs m 6m oi res ( R A M j_. .. RAM p ... RAM m ) 
agences en parallele, caracterise en ce que chaque registre & 
dScalage memoire ( RDM j ) est constitue par m reqistres & 
decalage elementaires (RDMjj... RDM jp ... RDM jm ) relics en 
parallfeles a la liaison serie cor responds nt e (LSj), chaque 

35 registre elementaire (RDM jp ) <§tant connecte & un banc 
memoire (RAM p ) de fa C on a permettre, en un cycle dudit banc 
memoire, un'transfert parallele en lecture ou ecriture d'un 
bloc d'informations (bi) entre ledit reqistre elementaire et 

ledit banc memoire. 
40 16/ - Systfeme multiprocesseur conforme h la 
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revendica t ion 15, dens lequel cheque liaison s£rie (LSj) est 
edatee en m liaisons series (LSj p ), reliant en point a point 
cheque processeur (CPUj) au regis tre a d^cslaqe 
5 eiementaire (RDMj ). 

17/ - Systeme multiprocesseur selon la 
revendication 15, dans lequel chaque banc memoire (RAM p ) est 
du type a acces aieatoire dote d'une entree/sortie de donnees 
de largeur correspondan t a un bloc d 1 i n f o r m a t i ons (bi), 

10 caracterise en ce que ladite entree/sortie de chaque banc 
memoire ( R A M p ) est r e 1 i e e par un bus parallele h 1 1 ensemble 
des registres eiementaires (RDH lp ... RDM j p ) • 

18/- Systeme multiprocesseur selon l'une-des 
revendications 15, 16 ou 17, synchronise par une horloge de 

15 frequence F au moins egale a 100 mdqahertz, caracterise en ce 
que chaque registre a decalage eiementaire memoire (R0Hj p ) et 
chaque registre a de"calaqe processeur (RDPj) sont d'un type 
adapte pour presenter une frequence de decalage au moins eqale 
& F.. 

20 19/ - Systeme multiprocesseur selon i'une des 

revendications 15, 16 ou 17 synchronise par une horloqe de 
frequence F au moins eqale a 100 megahertz, caracterise en ce 
que chaque registre a decalage eiementaire memoire et/ou 
chaque registre a decalage processeur est oonstitue d'un 

25 ensemble de 2 U sou s-re gi s t r es multiplexes (RDM j p , RDP j p )» 
chacun apte a presenter une frequence de decalage au moins 
eqale a F/ 2 u. 

20/ - Procede d'echange d 1 inf ormations entre 
une memoire centrale (RAH) organist e en blocs 

30 d 1 inf ormations (bi) et des processeurs (CPU^... CPUj... CPU n ) 
chacun dote d'une memoire-cache (MCj) organisee en blocs de 
meme taille (bi), et d'un repertoire ( RG j) et rie son 
processeur de gestion (PGj), de facon que I'echange entre 
memoire centrale (RAM) et chaque processeur (CPUj) s'effectue 

35 via la memoire-cache (MCj) de ce dernier, ledit procede etant 
caracterise en ce que chaque transfert de bloc d 1 inf ormations 
(bi) depuis la memoire centrale (RAM) vers la memoire-cache 
(MCj) d'un processeur donne (CPUj) consists : 

• h transferer, en un cycle de memoire 

40 centrale, le bloc (bi) de ladite memoire centrale (RAM) vers 
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un reqistre a decalage memoire (RDM j) de la taille d'un bloc, 
faisant partie d'un ensemble de reqistres a decalage (RDM^... 
RDM-... RDM n ) connectes a la m<Smoire centrale, 
5 , a transferer sur une liaison serie (LSj) le 

contenu du reqistre a decalage memoire (RDM j ) vers un reqistre 
a decalage processeur (RDPj) de meme capacite, associe a la 
memoire-cache (MC-) du processeur consider (CPUj), 

/ h transferer le contenu dudit registre a 

10 d«§calage processeur (RDPj) vers ladite memoire-cache (MCj). 

21/ - Procede d'echange d' inf or ma t ions entre 
une memoire centrale (RAM) organist en blocs 
d ' inf ormations (bi) et des processeurs (CPUj... CPUj... CPU n ) 
chacun dote d'une memoire-cache (MCj) organisee en blocs de 

15 memes tallies (bi), et d'un repertoire (RGj) et de son 
processeur de gestion (PGj)j d © fagon que l'6chanqe entre 
memoire centrale (RAM) et chaque processeur (CPU.) s'effectue 
via la memoire-cache (MCj) de ce dernier, ledit procede etant 
caracterise en ce que chaque transfert de bloc d'inf or mat ions 

20 (bi) depuis la memoire-cache (MCj) d'un processeur donnd 
(CPUj) vers la memoire centrale (RAM) consiste i 

. a transferer le bloc (bi) de ladite 
memoire-cache consider (MCj) vers un registre a Scalane 
-processeur (RDPj) de la taille d'un bloc, associe a ladite 

25 memoire-cache (MCj), 

. a transferer sur une liaison sdrie (*- 5 j) le 
contenu du reqistre a decalage processeur (RDPj) vers un 
registre a decalage memoire ( RDM j ) de meme capacite, affects 
au processeur consider dans un ensemhle de registres a 

3fl ddcalaqe ( R D M ^ . • • RDMj... RDM p ) connects a la memoire 
centrale (RAM), 

. a transferer, en un cycle de m6moire 
centrale, le contenu du registre a decalage memoire (RDMj) 
vers ladite memoire centrale (RAM). 

35 22/ - Composant memoire multiport serie, 

susceptible d'Squiper un systeme mul tiprocesseur conforme a 
l'une des r e vend i c a t i ons 1 a 19, caracterise en ce qu'il est 
constitue par un circuit inteqre comprenant une memoire a 
acces aieatoire (RAM) de larqeur predeterm inee correspondent a 

40 un bloc d'inf ormations (bi), un ensemble de registres a 
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decalage ( R D M 1 . . . R D M j • • • R D M n ) , chacun de capacity 
correspondent a la larqeur de le memoire, un bus parallele 
interne (BUSI) reliant l'acces de le memoire et les reqistres 
5 a d4calaqe, u n e loaique de selection d'un registre a 
decalaqe (L5R) adaptee pour valider la liaison sup le bus 
interne entre la mi moire et un registre a decalage 5 
predetermine, et un ensemble de broches externes 
d'ent ree/sortie (adbloc, arimot, numreg, cs, wr, rd, hitbloc, , 

10 norm al/con f iq , hi, di) pour l'entrSe d'adresses vers la 
memoire (RAM), pour i^ntree d^dresses vers la logique de 
selection (LSR), pour l'entree et la validation de commandes 
de transfert en lecture ou ecriture d'un bloc 
d' informations (bi) entre la m^moire (RAM) et les reqistres a 

15 decalage (RDMj), pour l'entree d'un signal d'horloqe vers 
cheque registre a decalaqe (RDM j ) , pour l'entree bit a bit 
d'un bloc d ! inf or mations (bi) vers chaque registre a decalaqe 
(RDM j ) et pour la sortie bit a bit d'un bloc d'inf ormations 
de chaque registre a decalage (RDMj)» 

20 23/ - Composant selon la re vendi cat ion 22, 

caracterisG en ce qu f il comprend au moins un registre de 
conf iqur ation (RCj, RC 2 «") possSdant des entrees de 
proqramma tion, chaque reqistre de configuration etant relie a 
une logique de for<?age (LF) connects h la memoire (RAH) et 

25 aux reqistres a decalage (RDM j ) en vue d'assurer le forgaqe 
d'etats de ladite memoire et desdits registres a decalaqe. 

24/ - Composant selon la revindication 23, 
permettant le choix de la taille des blocs d ? inf ormat ions (bi) 
traites, caracterise en ce que : 

30 -la memoire (RAM) est decouple en zones 

combinables pour permettre la memorisation des diverges 
tailles possibles de blocs d 1 inf ormations , 

- cheque registre a decalaqe ( R D M j ) est 
decoupe en tronpons combinables pour permettre de charger les - 

35 diverses tailles possibles de blocs d 1 inf ormations, avec des 
derivations aptes a assurer le decalage correspondent a chaque 
taille, 

- le bus interne (BUSI) est dote d'une 
loqique de multiplexaqe ( M T ) pour permettre les transferts de 

40 blocs d'inf ormations (bi) des diverses failles entre les 
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combinaisons de zones de la mdmoire (RAM) et les combinaisons 
correspondantes de troncons des reqistres a d^celage ( RDM j ) , 

- un reqistre de conf iquration (RC^) est 
5 prSvu de capacity correspondent au nombre de tailles de blocs 

possibles, 

- la loqique de forgaqe (LD relive au 
registre (RC 1 ) comprend une unite* logique adaptee pour 
commander la logique de multiplexaqe (MT) en vue de valider 

10 les transferts de blocs d 1 in forma tions (bi) dans une taille 
donn«§e correspondan t au parametre contenu dans le registre de 
configuration (RC^). 

2 5/ - Composant selon l'une des 

revendications 23 ou 24, caracte§ris<§ en ce que : 
25 _ l'entr€e et la sortie de chaque reqistre a 

dScalaqe (RDMj) sont relives a une meme broche externa par 
1 1 intermddiaire d f une porte loqioue ( p Lj), 

- un reqistre de configuration (RC£) est 
pr6vu de capacity correspondent au nombre de reqistres a 

20 decalage ( RDM j ) , 

-la logique de forgaqe (LF) relive au 

registre de configuration (RC 2 ) comprend une unite* logique 

adaptee pour commander les portes loqiques (PLj) en vue de 

forcer le f onct ionnement de chaque registre a d<§calage (RDMj) 

25 en mode entree ou en mode sortie en fonction d'un bit contenu 

dans le reqistre de configuration (RC 2 ) affectf audit reqistre 

a ri<§calage ( RDM j ) . 

26/ - Composant selon l f une des 

revendications 23, 24 ou 25, caract<§rise* en ce que : 
30 - l'entr<§e et la sortie de chaque reqistre a 

d«§caleqe (RDMj) sont relives a une mime broche externe par 
1 • interm<§diaire d'une porte logique ( PL j ) , 

- un reqistre de configuration (RC 3 ) est 
prSvu de capacity correspondent au nombre de reqistres a 

35 d<§calage (RDMj), 

-la looique de forpaqe (LF) relive au 
registre de configuration (RC 3 ) comprend une units looique 
relive a la commande de lecture de la memoire (RAM) et adapted 
pour commander chaque porte logique (PLj) soit en mode sortie 
40 au moment de la lecture de la memoire (transfert de la 
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mdmoire RAM vers le registre correspondant RDMj) pendant toute 
la dur6e du vidage dudit registre a dScalage (RDM j), soit en 
mode entree, le reste du temps. 
5 2 7/ - Composant selon 1 ' u n e des 

revendica tions 23, 24, 25 ou 26, caract<§ris<§ en ce qu'il 
comprend une broche externe d'entriSe (bit/bloc), une ou des * 
broches externes d'entr^e/sortie d l inform a tions (data), une 
loqiaue de commsnde (COM) relide a la broche d'entree s 

10 (bit/bloc), aux broches d'ent r^e/sor tie (data), a la tngmoire 
(RAH) et a la logique de selection (L5R) et adapted selon 
1'Stet de 1'entrSe (bit/bloc) pour enqendrer soit les 
transferts de blocs d 1 in f o rm a t ion s (bi) entre memoire (RAH) 
et registres a d^calage (RDM j ) , soit des transferts de bits 

15 directement entre la memoire (RAM) et les broches (data). 

28/ - Composant selon les re vend ica tions 23 
et 27 prises ensemble, caract<§ rise* en ce que les reqistres de 
conf iquration (RC lf RC 2 *««) sont relics 

• d'une part a la logique de selection (LSR) 

20 laquelle est adaptee pour s<5 1 ec t ionner lesdits registres de 
configuration pour des adresses pr6d6terminees affect«§es 
auxdits registres, 

- d'autre part, a la logique de 
commande (CnM) laquelle est adapted pour transmettre les 

25 donnees en provenance des broches d'entr6e/sortie (data) vers 
lesdits reqistres de conf iauration en vue de leur 
programmat ion . 

29/ - Composant selon 1 1 u n e d e s 
revendications 22 a 28, dans lequel sur le bus interne (BUSI) 

30 reliant I'acces de la memoire (RAM) et les reqistres a 
decalage ( RDM j) est interposee une logique de type "ba^illet ,, 
(BS) ("barrel shifter") apte a assurer une oermutation 
circulaire sur les bits de chaque bloc d'inf ormations, ladite 
loqique (BS) possedant une entree de commande du pas de 

35 qlissement en unite mot connected a des broches d'entree 
( admot) . 
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